GPT:x中之事,事无大小,悉以咨之
概念
加载器(Loader)
从某种介质中获取数据,即加载。
文档(Document)
数据转换成文档进行处理。类比数据库转换成记录……
文本分割(Text Spltter)
LLM一次处理的数据有限,分割成多批进行处理。
向量数据库(Vector stores)
文档转换成向量,把文档存入到向量数据库,自动转换成向量。
链(Chain)
任务
代理(Agent)
门面,可以根据情况进行一系统任务chain处理。
嵌入 Embedding
用于衡量文本的相关性。这个也是 OpenAI API 能实现构建自己知识库的关键所在。 他相比 fine-tuning 最大的优势就是,不用进行训练,并且可以实时添加新的内容,而不用加一次新的内容就训练一次,并且各方面成本要比 fine-tuning 低很多。 具体比较和选择可以参考这个视频:https://www.youtube.com/watch?v=9qq6HTr7Ocw
微调 fine-tuning
Fine-tuning(微调)是深度学习中的一种技术,它通常用于对事先训练好的神经网络模型进行调整以适应新的任务。
参考:
https://liaokong.gitbook.io/llm-kai-fa-jiao-cheng/