首页 > 其他分享 >基于GPT-2预训练模型chat 演示-代码说明

基于GPT-2预训练模型chat 演示-代码说明

时间:2023-03-21 09:44:38浏览次数:39  
标签:演示 训练 模型 MMI chat GPT 代码

基于GPT-2预训练模型chat 演示-代码说明

代码路径:shibing624/gpt2-dialogbot-base-chinese · Hugging Face

代码说明:4.MMI模型训练与生成_哔哩哔哩_bilibili

1 文本预处理

  下载语料

 

2 train

  1 dataset

2 dataloader

3 padding

4 打印训练loss,tensorboardx

5 try的目的为 加载超过mem可以舍弃但是又不至于终止训练。

  模型原理可以在huggingface链接查到

  模块使用方法也可以查到

3 推理

  预训练模型 可以在链接中查到

4 MMI

  说明MMi MMI(Maximum Mutual Information)在语言模型中,MMI model是一种将最大互信息准则应用于语言模型的建模方法。

  逆序拼接语料训练。

标签:演示,训练,模型,MMI,chat,GPT,代码
From: https://www.cnblogs.com/lx63blog/p/17238811.html

相关文章

  • springboot 接入 ChatGPT
    介绍lucy-chat是接入OpenAI-ChatGPT大模型人工智能的Java解决方案,大模型人工智能的发展是不可阻挡的趋势,我们环境无法创造工具,但是也要更好的使用工具,该包简化了接......
  • 如何使用ChatGPT赚钱之四
    目前网络上最热门的话题之一是如何使用ChatGPT赚钱。我们的文章讨论了使用AI工具赚钱的13种简单方法。我们将提供一些实际示例,说明如何从AI获得您想要的东西。由Elo......
  • 如何使用ChatGPT赚钱之三
    所有人正在谈论ChatGPT,OpenAI的“GPT”聊天机器人。它目前是免费使用的,可以尝试一下。但是你真的能帮助人们并通过ChatGPT赚钱吗?下面我将分享我如何使用它来赚钱并提供......
  • The Art of ChatGPT Prompting: A Guide to Crafting Clear and Effective Prompts
    AboutWhenChatGPTfirstlaunchedlastmonth,Iwasimmediatelycaptivatedbyitscapabilities.Iexperimentedwiththetoolinavarietyofwaysandwascons......
  • 使用ChatGPT赚钱的7个提示
    ChatGPT是OpenAI基于文本的人工智能模型,在短时间内获得了巨大的普及。它在推出后的短短1天内就拥有5万用户。该模型已经过大量资源的训练,可以响应几乎任何类型的查询。在......
  • chater 8
    商品零售购物篮分析#%%查看数据特征importnumpyasnpimportpandasaspdinputfile=r"D:\py_project\a_三下\GoodsOrder.csv"#输入的数据文件data=pd.......
  • 为什么今日未上台演示地铁程序?
    我们小组实力有限,在建民老师课上时,我们还未完成该完成的基础的功能。以下是我们组在课上实现的功能展示:原因:可见,我们的第三个功能:起点——终点查询还未完成,所以,我们......
  • GPT-4:我不是来抢你饭碗的,我是来抢你锅的
    GPT-4的闪亮登场,似乎再次惊艳了所有人。看了GPT-4官方的演示,涵盖方方面面,不禁让人感慨,通用人工智能真的要来了吗?GPT-4,可媲美人类据CNBC报道,GPT-4是采用微软的Azure公用......
  • 如何把自有数据接入GPT大模型?
    ChatGPT引发了AI革命,众人皆想探究如何让它发挥更大价值。以它为代表的大模型并未完全掌握所有专业知识,这也正是我们创业的契机。我们应该思考如何让AI在专业领域中释放......
  • GPT-4:不open的OpenAI,终于不再编造事实
    去年,ChatGPT横空出世,带着独特的大型预训练模型,掀起了GPT和AIGC的浪潮,一时之间关于OpenAI的话题不断,各互联网大厂都纷纷入局,想要加入这场“变革”的狂欢。但在GPT......