附上参考链接:Datawhale
简单介绍下背景知识
一.背景知识
1.大模型的定义:
为了对人类语言的内在规律进行建模,研究者们提出使用语言模型(language model)来准确预测词序列中 下一个词
或者 缺失的词
的概率。
目前已经有四代语言模型了
1) 统计语言模型(Statistical Language Model, SLM):
使用马尔可夫假设(Markov Assumption)来建模语言序列的
标签:第四期,tokenizer,AI,模型,Datawhale,st,state,session,model From: https://blog.csdn.net/cch3311543544/article/details/141113253