首页 > 其他分享 >[NLP/AIGC] 大语言模型:零一万物

[NLP/AIGC] 大语言模型:零一万物

时间:2024-09-12 22:48:36浏览次数:10  
标签:零一 NLP 34B 模型 AIGC 开源 Yi https

1 概述:零一万物 - 首款开源中英双语大模型

公司背景

  • 公司名称:零一万物(01.AI)
  • 创始人:李开复博士(知名投资人、创新工场董事长兼CEO)

产品介绍

  • 产品名称:Yi 系列大模型
    • Yi-6B:数据参数量为60亿的双语(英文/中文)开源模型
    • Yi-34B:数据参数量为340亿的双语(英文/中文)开源模型,全球多项评测基准中领先

Yi-34B 模型亮点

  • 全球领先:在多项评测中取得SOTA(国际最佳性能)指标,英文和中文权威排行榜榜首
  • 成本效益:基于超强Infra下模型训练成本实测下降40%,模拟千亿规模训练成本可下降多达50%
  • 超长上下文:支持200K超上下文窗口,能够处理大约40万汉字的超文本输入
  • 功能丰富:支持通用聊天、问答、对话、写作、翻译等功能

官方资源

  • Github开源地址
  • 项目地址
  • 免费试用

论文与API

模型特性

  • Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能
  • Yi-34B-Chat-200K:超长上下文版本,适合多篇文档内容理解、海量数据分析挖掘和跨领域知识融合
  • Yi-VL-Plus:多模态模型,支持文本、视觉多模态输入,中文图表体验超过GPT-4V

应用场景

  • 专业书籍翻译:如《机器学习工程》电子书,一天内完成264页翻译
  • 金融分析:快速阅读报告并预测市场趋势
  • 法律解读:精准解读法律条文
  • 科研辅助:高效提取论文要点

技术优势

  • 全球领跑:在MMLU等评测中取得多项SOTA性能指标
  • 模型尺寸轻巧:以更小模型尺寸评测超越大尺寸开源模型
  • 满足多元需求:Yi-6B适合个人及研究用途,Yi-34B适合多元场景
  • 免费商业授权:对学术研究完全开放,同步开放申请免费商业授权

用户体验

  • 超长上下文:提升模型理解深度,适合长篇文本处理
  • 多模态能力:支持图片、表格、图表等识别与理解,中文体验超过GPT-4V

部署与启动

  • 一键启动包:无需配置Python环境,简单点击即可启动
  • 步骤
    1. 下载压缩包并解压
    2. 根据显卡类型选择启动软件(NVIDIA、CPU、AMD)
    3. 点击Launch按钮并选择模型文件启动
    4. 在浏览器中访问 http://localhost:5001/ 免费使用

X 参考文献

标签:零一,NLP,34B,模型,AIGC,开源,Yi,https
From: https://www.cnblogs.com/johnnyzen/p/18411265

相关文章

  • NLP(文本处理技术)在数据分析中的应用实例
    在Python中,你可以实现多种自然语言处理(NLP)技术。Python拥有丰富的库和框架,使得NLP任务变得更加容易和高效。接下来将列举一些NLP(文本处理技术)具体功能的Python实现。一:文本预处理1:英文版#文本预处理#导入所需的库importrefromtextblobimportTextBlobfromgensim......
  • [AI/NLP] 大语言模型排行榜 | 2024.06
    0引言通过排行榜,能快速了解各模型/产品的技术竞争力、综合竞争力。1通用-总排行榜闭源+开源排名模型机构总分理科得分文科得分Hard得分使用方式国内/国外备注1GPT-4oOpenAI81817685API国外2Claude-3.5-Sonnet-200kAnthropic77757284A......
  • AIGC 工具智启特的使用感受
    界面友好:智启特的界面设计简洁明了,各项功能模块清晰,使得用户能够快速上手。同时,界面的响应速度较快,操作流畅,给用户带来了良好的体验。功能强大:智启特提供了丰富的功能,包括文本生成、图像生成、语音合成等,满足了我在不同场景下的需求。此外,智启特还支持多种语言,使得我能够更方便地进......
  • 干货|一文告诉你AIGC产品需要办哪些资质?
    随着人工智能技术的不断发展,AIGC已经成为一个重要的领域。在AIGC领域中,需要办理多种行业资质,包括算法备案等,以确保企业能够合法、合规地开展相关业务。下面,众森企服小编就来给大家好好讲讲AIGC产品上线需要办哪些资质?我们首先来看下AIGC生成式人工智能是什么?AIGC,全称叫“Arti......
  • AIGC大师秘籍:六步法打造精准文字提示词
    ......
  • 墙裂推荐:《Transformer自然语言处理实战:使用Hugging-Face-Transformers库构建NLP应用
    大家好,今天给大家推荐一本大模型神书——《Transformer自然语言处理实战:使用Hugging-Face-Transformers库构建NLP应用》。近年来,Transformer模型在NLP领域取得了显著成果。为了让广大开发者更好地掌握这一技术,给大家推荐一本实战教程——《Transformer自然语言处理实战:使用......
  • [NLP] TextRank 算法
    1概述:TextRank算法1.1TextRank算法:源于PageRank算法感兴趣PageRank的朋友,请转阅:[机器学习/Python]PageRank原理与实现-博客园/千千寰宇TextRank算法基于PageRank,用于为文本生成关键字、摘要、计算语句(短语或者词汇)的重要性排名,而PageRank最初是因Google搜索......
  • Python与Go在AIGC领域的应用:比较与分析
    1.引言AIGC(ArtificialIntelligenceGeneratedContent,人工智能生成内容)近年来在图像生成、自然语言处理、代码生成等多个领域取得了重大进展。无论是文本生成、图像创作,还是自动代码生成,AIGC都在推动内容创作进入一个全新的高度。Python凭借其简洁的语法和丰富的机器学习、深度学......
  • [NLP] One-Hot编码
    1OneHot编码1.1定义One-Hot编码,又称独热编码。从方法性质上讲,它是一种向量表示方法,属于自然语言处理领域中的词袋模型。独热编码方法使用N位状态寄存器对N个状态进行编码,每个状态都有独立的寄存位;并且在任意时候,N为状态寄存器中都仅有一位有效状态,该位的状态值则表征了......
  • AIGC技术打造扫描“黑科技” 合合信息扫描全能王实现在扫描中“博物致知”
    在2024年世界人工智能大会(WAIC)上,合合信息旗下的扫描全能王携手华南理工大学团队展示了他们利用AIGC技术进行的古籍数字化修复成果,为传统文化的传承与保护树立了新的里程碑。现场,《汉书•刑法志》节选章节的修复效果令人叹为观止。这部珍贵的文献,作为研究汉代司法制度的重要......