书生浦语大模型是一个全链条的开源体系,支持长达20万汉字的输入,是全球大模型产品中支持的最长上下文输入长度。模型具备超长上下文、推理数学代码、对话和创作体验、工具调用等能力。书生浦语大模型致力于大模型研究与开发工具链的开源组织。为所有 AI 开发者提供高效、易用的开源平台,让最前沿的大模型与算法技术触手可及。
书生浦语大模型自发布以来,经历了快速迭代,包括升级千亿参数大模型、支持8K上下文等,直到2024年1月17日正式开源了InternLM2,相对于第一代,InternLM2有了很大的提升,也能够去解决更多真实任务和更复杂的应用场景的问题。目前InternLM2根据不同的需求,有InternLM2-7B和InternLM2-20B规格,每个规格包含三个模型版本,InternLM2-Base、InternLM2、InternLM2-Chat,都在社区内已经开源。
书生浦语大模型体系包括:
模型:
InternLM:一系列多语言基础模型和聊天模型。
InternLM-Math:最先进的双语数学推理 LLM。
InternLM-XComposer:基于 InternLM 的视觉语言大型模型 (VLLM),用于高级文本图像理解和合成。
工具链:
InternEvo:用于大规模模型预训练和微调的轻量级框架。
XTuner:用于高效微调 LLM 的工具包,支持各种模型和微调算法。
LMDeploy:用于压缩、部署和服务 LLM 的工具包。
Lagent:一个轻量级框架,允许用户高效构建基于 LLM 的代理。
AgentLego:一个多功能工具 API 库,用于扩展和增强基于 LLM 的代理,与 Lagent、Langchain 等兼容。
OpenCompass:一个大型模型评估平台,提供公平、开放和可重复的基准。
OpenAOE:一个优雅且开箱即用的聊天 UI,用于比较多个模型。
应用:
HuixiangDou:一个基于 LLM 的领域特定助手,可以处理群聊中的复杂技术问题。
MindSearch:一个基于 LLM 的 Web 搜索引擎多代理框架。