Java手搓简易Transfomer - Attention部分

Attension也是整个 Transformer 里最精髓的部分了, 也卡了我相当之久前向传播解析部分注意力公式如下, 很晦涩, 但我尽可能以简单的方式来解释这些问题$$ Attention(Q,K,V)=softmax\left(...

AgenticCoding 时代, 人类程序员到底如何做

Ai Coding能力的巨大提升2022 年末 2023 年初, ChatGPT 的横空出世, 让人们看到了真正的人工智能走向普通人的生活, 在 GPT3.5 时期, AI 的 Coding 能力还处在一个有待观察的阶段, 而在短短的...

Java手搓简易Transfomer - Tokenizer部分

搭建一个简易的词表, 把每个符号转换为token, 因为这样最简单了😭 public Tokenizer(String dirName){ this.dirName = dirName; thi...

我自己的Github推荐 - SlimGPT GPT对话优化插件

简介在下实在受不了 ChatGPT 在长对话时的逆天卡顿,以及想上翻找到某个对话时自己一点一点翻的困难,于是vibe出了SlimGPT这个 Chrome/Edge 插件,用于优化一下ChatGPT网页版那个垃圾的不得了的东西解决的问题...