首页 > 其他分享 >大语言模型(LLM)

大语言模型(LLM)

时间:2024-03-30 16:36:42浏览次数:23  
标签:语言 AI 模型 OpenAI LLM GPT ChatGPT

大语言模型 LLM

人工智能 Artificial Intelligence

一门研究如何使计算机能够模拟和执行人类智能任务的科学和技术领域

是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工:计算机来模拟人

智能:人的某些思维过程和智能行为(如学习、推理、思考、规划等)

AGI(通用人工智能 Artificial General Intelligence)

是指一种能够像人类一样思考、学习和执行多种任务的人工智能系统。

AGI的目标是创建一个全面智能的系统,可以解决广泛的问题并进行多种任务。这种系统能够在不同的环境中适应和学习,并且可以从不同的来源中获取信息,像人类一样进行推理和决策。

亦被称为强 AI,该术语指的是在任何你可以想象的人类的专 业领域内,具备相当于人类智慧程度的 AI,一个 AGI 可以执行任何人类可以完成的智力任务。

大语言模型 Large Language Model

也称大型语言模型,是一种人工智能模型。

旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。

LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。

大语言模型可以做什么?

以下是 LLM 为组织带来益处的一些最重要的领域:

  • 文本生成:语言生成能力,如根据提示撰写电子邮件、博客文章或其他中长篇内容,并加以提炼和润色。

  • 内容摘要:将长文章、新闻报道、研究报告、公司文档甚至客户历史记录汇总成根据输出格式定制长度的完整文本。

  • AI 助手:聊天机器人,可以回答客户询问、执行后端任务并以自然语言提供详细信息,作为集成式自助客户服务解决方案的一部分。

  • 代码生成:帮助开发人员构建应用程序,查找代码中的错误并发现多种编程语言中的安全问题,甚至在它们之间进行“翻译”。

  • 情感分析:分析文本,确定客户的语气,以便大规模了解客户反馈并帮助进行品牌声誉管理。

  • 语言翻译:通过流畅的翻译和多语言功能,为各语言和地域的组织提供更广泛的覆盖范围。

常见大语言模型

国外

Chatgpt(OpenAI)

  • Our vision for the future of AGI:
    Our mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanity.

  • History:

    OpenAI 成立于2015年,其使命是“确保人工智能的发展能够造福所有人类,而不受少数人或机构的控制”。

    2018 年 6 月 OpenAI 发布 GPT-1 模型,1.1亿参数。

    2018 年 11 月 OpenAI 发布 GPT-2 模型,15亿参数。

    2019 年 6 月 10 日 OpenAI 发布 GPT-3 模型,1750亿参数,并向部分合作伙伴提供了访问权限。

    2019 年 9 月 OpenAI 开放了 GPT-2 的全部代码和数据,并发布了更大版本。

    2020 年 5 月 OpenAI 宣布推出 GPT-3 模型的beta版本,该模型拥有1750亿个参数,是迄今为止最大的自然语言处理模型。

    2022 年 11 月 30 日 OpenAI 通过 GPT-3.5 系列大型语音模型微调而成的,全新对话式AI模型 ChatGPT 正式发布。

    2023 年 3 月 15 日 OpenAI 震撼推出了大型多模态模型 GPT-4,不仅能够阅读文字,还能识别图像,并生成文本结果,现已接入 ChatGPT 向Plus用户开放。

  • How to use

    • 2023 年 3 月 20 日开始,OpenAI 开始大面积封号,禁止使用亚洲节点登录。

    • 在国内使用 Chatgpt 并不违法。只是 ChatGPT 屏蔽中国用户。

    • Github 镜像仓库。

    GitHub - LiLittleCat/awesome-free-chatgpt:

    标签:语言,AI,模型,OpenAI,LLM,GPT,ChatGPT
    From: https://www.cnblogs.com/alloverzyt/p/18091127

相关文章

  • 《自动机理论、语言和计算导论》阅读笔记:p68-p114
    《自动机理论、语言和计算导论》学习第4天,p68-p114总结,总计47页。一、技术总结1.invertedindexes明白单词的意思是“反转的索引”,但是不明白其在书中具体指什么,去查询资料的话需要花很不多时间,先继续往下看。遇到这种场景的可能性还是比较多的。2.lexicalanalysis(1)lexico......
  • 文件管理(C语言)
    文章目录文件管理文件文件的打开/关闭fopenfclose文件的顺序读/写fputcfgetcfputsfgetsfwritefreadfprintffscanf文件的随机读写fseekftellrewind文件结束标志的判定feofferror总结读取文件的函数的返回值fgetcfgetsfread补充函数sprintfsscanf文件缓冲区文件......
  • C语言---自定义类型:结构体
    文章目录前言1.结构体类型的声明2.结构体变量的创建和初始化2.1.创建结构体变量2.2.结构体变量的初始化2.3.嵌套结构体变量2.4.结构体的自引用3.结构成员访问操作符3.1.结构体成员的直接访问3.2.结构体成员的间接访问4.结构体内存对齐4.1对齐规则4.2为什么存在内......
  • 探索大模型微调:分享我的学习经历
    近年来,随着深度学习技术的不断发展,大模型微调(Fine-tuning)成为了机器学习领域一个备受关注的话题。在这个充满活力的领域里,我有幸参加了一门关于大模型微调的课程,并在学习过程中积累了一些经验和心得。在本文中,我将分享我在这门课程中的学习心得,以及对大模型微调的一些思考。了......
  • 大模型面试准备(七):ChatGPT 的内核 InstructGPT 详细解读
    节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何备战、面试常考点分享等热门话题进行了深入的讨论。合集在这里:《大模型面试宝典》(2024版)正式发......
  • 人工智能伦理与法律:大模型的责任归属与监管框架研究
    人工智能伦理与法律:大模型的责任归属与监管框架研究1.背景介绍随着人工智能技术的飞速发展,特别是大模型的广泛应用,人工智能伦理和法律问题日益凸显。大模型,如深度学习、自然语言处理等,在提供便利的同时,也带来了诸如数据隐私、算法偏见、责任归属等伦理和法律问题。本文旨......
  • qt语言国际化(翻译),并实现多窗口同时翻译
    https://blog.csdn.net/qq_15181569/article/details/135934033一、.pro文件中添加支持的语言在.pro文件中添加下面几句,支持中文和英文TRANSLATIONS=lanague_cn.ts\lanague_en.ts12二、通过qt语言家更新翻译生成.ts文件完成以后在工程目录可以看......
  • 面了字节 NLP 算法工程师(含大模型方向),跪了。。。
    节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集:《大模型面试宝典》(2024版)发布!......
  • Verilog语法回顾--门级和开关级模型
    目录门和开关的声明门和开关类型支持驱动强度的门延迟实例数组and,nand,nor,or,xor,xnorbuf,notbufif1,bufif0,notif1,notif0MOSswitchesBidirectionalpassswitchespullup,pulldown参考《Verilog 编程艺术》魏家明著Verilog共有14中逻辑门和12种开关,用于提供门级和开关......
  • C语言查找-----------BF算法&&KMP算法
    1.问题引入有一个主字符串,有一个子字符串,要求我们寻找子字符串在主字符串里面开始出现的位置;2.BF算法BF算法就是暴力算法,这个做法虽然效率不高,但是按照我们传统的思路依然能够得到结果,接下来我们使用C语言实现这个查找的过程;#include<stdio.h>#include<assert.h>#includ......