• 2024-09-30BERT训练之数据集处理(代码实现)
    目录1读取文件数据 2.生成下一句预测任务的数据 3.预测下一个句子 4.生成遮蔽语言模型任务的数据 5.从词元中得到遮掩的数据 6.将文本转化为预训练数据集7.封装函数类8.调用importosimportrandomimporttorchimportdltools1读取文件数据def_read_wik
  • 2024-09-30BERT训练环节(代码实现)
    1.代码实现#导包importtorchfromtorchimportnnimportdltools#加载数据需要用到的声明变量batch_size,max_len=1,64#获取训练数据迭代器、词汇表train_iter,vocab=dltools.load_data_wiki(batch_size,max_len)#其余都是二维数组#tokens,segments,valid
  • 2024-09-29ChatGPT第三方推荐及省钱技巧
    一直想找寻一款好用的ChatGPT国内代理,但目前国内代理太多了,良莠不齐,用过好几款,但都因各种原因放弃了。GPT第三方API推荐直到遇到了它 V3API 33优点能用的模型多:使用标准的OpenAI接口协议访问68+模型,支持ChatGPT(所有模型)、Claude3.5、Gemini、Glm-4等系列最新模型,支持
  • 2024-09-28北邮&剑桥最新SLM(小语言模型)研究综述
    今天介绍的这篇文章是关于小型语言模型(SmallLanguageModels,SLMs)的研究综述,作者团队来自北京邮电大学、鹏城实验室、HelixonResearch、剑桥大学等机构。语言模型的发展目前呈现出分歧,一方面是追求人工通用智能的LLMs,在训练和推理双scalinglaw的指引下不断加大计算量;另一
  • 2024-09-26transformers中的generate函数解读
    转载:https://zhuanlan.zhihu.com/p/654878538这里仅当学习记录,请看原文,排版更丰富转载补充:https://www.likecs.com/show-308663700.html 这个非常的清晰明了,也建议前往学习今天社群中的小伙伴面试遇到了一个问题,如何保证生成式语言模型在同样的输入情况下可以保证同样的输出
  • 2024-09-26一个基于Transformer模型的中文问答系统926.1
    这个代码实现了一个基于Transformer模型的中文问答系统。以下是代码的主要功能和可能的完善方向:主要功能数据处理:代码首先定义了处理中文文本的函数,包括分词、构建词汇表、将句子转换为张量等。数据加载:从.jsonl或.json文件中加载问题和答案数据,并进行数据增强。模型定
  • 2024-09-23完整的端到端的中文聊天机器人
    这段代码是一个完整的端到端的中文聊天机器人的实现,包括数据处理、模型训练、预测和图形用户界面(GUI),下面是对各个部分功能的详细说明:1.导入必要的库importosos.environ['CUDA_LAUNCH_BLOCKING']='1'importtorchimporttorch.nnasnnimporttorch.optimasopti
  • 2024-09-22创建对外部存储库的拉取请求
    本周的重点是实验2,其中涉及通过创建拉取请求(pr)为我不拥有的存储库做出贡献。我首先选择一个同学的存储库来进行工作。鉴于javascript是我的主要编程语言,我选择了基于javascript的存储库来简化我的工作流程。虽然我愿意探索其他语言,但我选择js项目节省了时间,让我可以更
  • 2024-09-12NLP(文本处理技术)在数据分析中的应用实例
    在Python中,你可以实现多种自然语言处理(NLP)技术。Python拥有丰富的库和框架,使得NLP任务变得更加容易和高效。接下来将列举一些NLP(文本处理技术)具体功能的Python实现。一:文本预处理1:英文版#文本预处理#导入所需的库importrefromtextblobimportTextBlobfromgensim
  • 2024-09-11使用Java实现字符串中的表达式计算
    /***计算字符串表达式的值,不支持小数*<ul>*<li>加法('+')</li>*<li>减法('-')</li>*<li>乘法('*')</li>*<li>除法,保留两位小数('/')</li>*<li>取余,获取商('
  • 2024-09-10LLM 工程师入门:生成式 AI 的简易指南
    大模型发展了近两年,BaihaiIDP也分享了近百篇LLM各环节的技术洞察,有前沿探讨、有落地实践、有应用经验。但回头来看,我们似乎从来没有认真、从0开始探讨过LLM的基本原理。最近,一些企业客户和伙伴来询问,是否有LLM的从0到1的科普贴。他们说:"虽然在很多场景中,L
  • 2024-09-07LLM 工程师入门:生成式AI的简易指南
    编者按:大模型发展了近两年,BaihaiIDP也分享了近百篇LLM各环节的技术洞察,有前沿探讨、有落地实践、有应用经验。但回头来看,我们似乎从来没有认真、从0开始探讨过LLM的基本原理。最近,一些企业客户和伙伴来询问,是否有LLM的从0到1的科普贴。他们说:"虽然在很多场景中,LLM都已
  • 2024-09-06Go简单实现几种常用的限流
    固定窗口packagemainimport("fmt""sync""sync/atomic""time")//定义限流结构体typeRateLimiterstruct{intervaltime.Duration//时间窗口tokensint32//令牌总数lastTimeint64
  • 2024-09-03Java、python、php版 舞蹈工作室管理系统 舞蹈课程预约平台(源码、调试、LW、开题、PPT)
  • 2024-08-30逆波兰表达式求值
    这段代码实现了一个用来计算逆波兰表达式(ReversePolishNotation,RPN)的算法。逆波兰表达式是一种后缀表达式,操作符在操作数的后面。这个算法通过使用栈来逐步求值表达式中的操作数和操作符。代码:classSolution{public:/***代码中的类名、方法名、参数名已
  • 2024-08-29带记忆的对话api上线
    API简介Link.AI已为开发者提供了调用智能体能力的对话API,可在第三方系统和服务中使用Link.AI应用智能体和工作流智能体的能力。在使用普通对话API时,开发者需要在每次请求时传入会话的对象和上下文,以实现智能体的“记忆”功能,从而实现多轮对话。相比普通对话API,Link.AI记忆
  • 2024-08-24使用GPT设计一个脚本语言解释器
    Q:我们重新开始设计,每个Parser必须包含两个方法,一个方法是parse(self,main_parser),另一个方法是try_parse(tokens,position)。parse方法里转调用try_parse,只有try_parse返回非空结果和位置信息时在parse方法里才会真正改变main_parser的position。每个parser的try_parse方法里,
  • 2024-08-21修改模型的embedding
    Huggingface|修改模型的embedding 目标:在NLP领域,基于公开语料的预训练模型,在专业领域迁移时,会遇到专业领域词汇不在词汇表的问题,本文介绍如何添加专有名词到预训练模型。NLP的处理流程:对输入的句子进行分词,得到词语及下标通过embedding层获得词语对应的embeddingembe
  • 2024-08-21【大模型理论篇】大模型时代下Bert去哪啦?
        这个标题是最近看到的一篇文章《WhathappenedtoBERT&T5?OnTransformerEncoders,PrefixLMandDenoisingObjectives》有感而发,也感觉很有意思。在几年前,在项目中还经常会用到Bert。本文主要回顾一下Bert的原理、Bert的继续训练和使用,以及对看到的文章中关
  • 2024-08-20150. 逆波兰表达式求值
    题目描述给你一个字符串数组tokens,表示一个根据逆波兰式表示法表示的算术表达式。请你计算该表达式。返回一个表示表达式值的整数。解题思路我们依次遍历数据,如果遇到数字我们就直接入栈,如果遇到运算符,我们就取出栈顶的元素两个,然后进行运算,这里要注意-和/这两个运算符,取栈
  • 2024-08-16【课程总结】day24(下):大模型部署调用(vLLM+LangChain)
    前言在上一章【课程总结】day24(上):大模型三阶段训练方法(LLaMaFactory)内容中主要了解一个大模型的训练过程,无论是第三方的大模型还是自研的大模型,都需要部署到服务端,提供对应API接口供上层应用使用。所以,本章将主要了解vLLm+langchain的基本使用方法。大模型应用框架
  • 2024-08-14ollama的set parameter的参数的注解
    >>>/setparameterAvailableParameters:/setparameterseed<int>Randomnumberseed/setparameternum_predict<int>Maxnumberoftokenstopredict/setparametertop_k<int>Pickfromtopk
  • 2024-08-11基于Python的大模型学习手册(入门级)
    前言大模型(全称为大语言模型,英文名称:LargeLanguageModel),这个2023年刷爆了互联网圈的“现象级明星”,几乎以前所未有的姿态,席卷了各行各业,世人一时为之惊叹。同时,也开辟了各大厂商投入AI研发的新赛道。乘着这波“西风”,国内大模型开启了雨后春笋般的神奇发育,简直是“一浪
  • 2024-08-10代码随想录Day11
    150.逆波兰表达式求值给你一个字符串数组tokens,表示一个根据逆波兰表示法表示的算术表达式。请你计算该表达式。返回一个表示表达式值的整数。注意:有效的算符为'+'、'-'、'*'和'/'。每个操作数(运算对象)都可以是一个整数或者另一个表达式。两个整数之间的除法总是
  • 2024-08-07LeetCode150 逆波兰表达式求值
    前言题目:150.逆波兰表达式求值文档:代码随想录——逆波兰表达式求值编程语言:C++解题状态:成功解答!思路还是利用栈的思想,遍历到数字时,加入栈,遍历到运算符时,取出两个数进行运算,并将结果加入到栈中。代码classSolution{public:intevalRPN(vector<string>