BERT

发表于 2024/04/18 更新于 2024/06/09

作者 Moear

1 分钟阅读

既生BERT,何生LLM?

在学习之前,首先需要了解一下注意力机制,注意力机制首先出现在一篇名为Attention is all you need的论文上这篇论文提出了一种名为Attention的全新机制,比较以往的RNN要更加先进大致模块运行如下

为了方便理解,可以借助一些可视化项目了解: dodrio

比方说这里的villain单词和之前的5个单词有着各自不同的关系的link

本文由作者按照 CC BY 4.0 进行授权