首页 > 其他分享 >1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4

1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4

时间:2023-08-26 20:56:56浏览次数:40  
标签:1300 AI 模型 MathGPT 数学 GPT 专栏 教育

前言 数学的命运齿轮从此开始转动。国内首个专为数学打造的千亿级大模型MathGPT正式上线,在多项基准测试中碾压GPT-4,刷新SOTA。

本文转载自新智元

仅用于学术分享,若侵权请联系删除

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!

数学AI大模型,或许会改变这个领域的未来。

今天,国内首个数学领域千亿级大模型MathGPT开启内测!即日起,便可通过官网申请注册账号免费试用体验。

内测申请地址:http://www.mathgpt.com

这背后,是深耕数学领域20年的公司「好未来」团队自研,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型。MathGPT,是国内首个专为数学打造的大模型。仅需要通过文字或图片上传数学题,即可得到对话式的解答反馈。另外,你也可以通过「随机来一题」的选项,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端体验。

领先的数学解题能力

其实,早在今年5月,好未来就曾公布正在进行自研数学大模型的研发,命名为MathGPT。据CTO田密介绍,MathGPT汇集了好未来多年教育教研数据积累,专注于数学领域。其中,千亿级大模型的训练、推理、部署框架,为模型赋予了强大能力。而优质教育数据,实现了题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现。此外,借助人类反馈对齐,模型的综合素养也得到进一步提升。从评估结果来看,MathGPT在解题准确率、稳定性及用户体验方面均有明显的优势。

MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,不过还暂未开放数学之外的问答互动。

MathGPT技术报告

MathGPT技术报告显示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和Math401等6个公开数学评测集合的测试结果中,好未来的MathGPT取得了多项测试的最高分数。同时,MathGPT在C-Eval的初高中的全科测试集合上也均有不错的表现。

MathGPT在C-Eval榜单初高中各科成绩在解题稳定性、讲解友好度方面,MathGPT基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。以一道数列题为例,MathGPT给出的答案包含「分析」、「详解」、「点睛」三个部分,比通用大模型的粗略讲解方式更为细致。其中,「分析」提供了题目的解题思路、思考方式,帮助用户更好地理解题目,「详解」则给出具体的计算方式和答案,最后「点睛」的环节,对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。

对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用AI产品解答数学问题的核心需求。

此外,在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。田密介绍,希望让MathGPT在数学教育领域发挥更大作用,好未来愿意把基于大规模、高质量的内容的千亿级大模型研发经验方法和业内分享,和行业共同进步。

好未来AI的厚积薄发

在AI浪潮的推动下,今年以来多家科技公司宣布推出通用大语言模型产品,而好未来选择了另一个方向,不基于将现有大语言模型做微调和接口调用、不做通用大语言模型,而是深入数学的垂直领域研发大模型,致力于打造自主、稳定、可持续、高质量的数学解决方案。通用大模型「重文轻理」,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。而在另一个层面,在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做这方面的研究。「好未来在数学的数据和业务上有20年的积累,有大量的教育数据的积累和持续生产教育数据的能力,所以选择做这个难而正确的事情。」田密称,好未来希望用自己在数学和AI上的多年积累,做好AI大模型时代的数学基础工作。早在2017年,好未来便成立了AI lab人工智能实验室。基于智慧教育人工智能开放创新平台助力,好未来AI lab获得各类顶级学术会议比赛冠军16项,亚军6项,发表国际期刊和会议高水平学术论文近百篇。2019年,科技部宣布依托好未来建设智慧教育国家新一代人工智能开放创新平台,好未来成为教育行业首批唯一一家人工智能“国家队”成员,在人工智能领域有多年深入研究。多年来,好未来以教育行业重大需求为牵引,构建了面向教育的人工智能算法能力、应用解决方案、基础软硬件体系和开源开放服务的国家教育科技创新平台。好未来也在积极参与推动大模型标准体系建设,先后作为核心单位参与了由国家人工智能标准化总体组组织的大模型系列国家标准、中国信通院牵头编制的「大模型预训练模型技术和应用评估方法」系列团体标准,以及教育部教育信息化技术标准委员会暨全国信息技术标准化技术委员会主导的「教育通用大模型」系列标准编制工作。近期,好未来正作为牵头单位与中国信通院、复旦大学、科大讯飞、百度等行业领先科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。

用AI实现大规模因材施教

随着大语言模型的兴起,如何用AI技术服务各行各业是社会关注的焦点。教育行业是最早开始布局AI领域的行业之一,AI能为教育生态带来何种变化一直备受关注。「AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。」田密介绍,20年来,好未来一直在探索个性化学习,从线下小班到线上大班,再到AI课,形式不断进化,但教的内容始终是固定的、学生和老师互动较少、颗粒度只能到题目级别。田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。在AI能力的加持下,「学生自学+AI答疑」的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导,每个学生都能得到最适合自己的学习内容。以MathGPT为基础,好未来将不断探索AI环境下的学习方式,更好地服务于全球的学习者、数学爱好者,并将经验及时与行业分享,通过AI技术助力教育科技的积极改变。据田密介绍,随着内测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。

参考资料:https://www.mathgpt.com

 

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

新认识了几位专注AI的大佬!

如何看待稚晖君的时间管理水平?

重新思考 视频超分辨 Transformers 中的对齐

RecursiveDet | 超越Sparse RCNN,完全端到端目标检测的新曙光

ICCV 2023 | ReDB:可靠、多样、类平衡的域自适应3D检测新方案!

大厂必考深度学习面试题及参考答案

ICCV2023 | 清华大学提出FLatten Transformer,兼顾低计算复杂度和高性能

ICCV'23 | MetaBEV:传感器故障如何解决?港大&诺亚新方案!

ICCV 2023 | 旷视研究院入选论文亮点解读

RCS-YOLO | 比YOLOv7精度提高了2.6%,推理速度提高了60%

国产130亿参数大模型免费商用!性能超Llama2-13B支持8k上下文,哈工大已用上

KDD 2023奖项出炉!港中文港科大等获最佳论文奖,GNN大牛Leskovec获创新奖

大连理工联合阿里达摩院发布HQTrack | 高精度视频多目标跟踪大模型

ICCV 2023 | Actformer:从单人到多人,迈向更加通用的3D人体动作生成

ReID专栏(二)多尺度设计与应用

ReID专栏(一) 任务与数据集概述

libtorch教程(三)简单模型搭建

libtorch教程(二)张量的常规操作

libtorch教程(一)开发环境搭建:VS+libtorch和Qt+libtorch

NeRF与三维重建专栏(三)nerf_pl源码部分解读与colmap、cuda算子使用

NeRF与三维重建专栏(二)NeRF原文解读与体渲染物理模型

NeRF与三维重建专栏(一)领域背景、难点与数据集介绍

异常检测专栏(三)传统的异常检测算法——上

异常检测专栏(二):评价指标及常用数据集

异常检测专栏(一)异常检测概述

BEV专栏(二)从BEVFormer看BEV流程(下篇)

BEV专栏(一)从BEVFormer深入探究BEV流程(上篇)

可见光遥感图像目标检测(三)文字场景检测之Arbitrary

可见光遥感目标检测(二)主要难点与研究方法概述

可见光遥感目标检测(一)任务概要介绍

TensorRT教程(三)TensorRT的安装教程

TensorRT教程(二)TensorRT进阶介绍

TensorRT教程(一)初次介绍TensorRT

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

聊聊计算机视觉入门

标签:1300,AI,模型,MathGPT,数学,GPT,专栏,教育
From: https://www.cnblogs.com/wxkang/p/17659419.html

相关文章

  • GPT-4人工智能:下载与应用指南,开启智能时代的新篇章
    GPT-4是一种先进的人工智能技术,本文将指导您如何下载和应用GPT-4,并展望它在智能时代的应用前景。GPT-4,即"GenerativePre-trainedTransformer4",是一种基于深度学习的生成式预训练模型。它是OpenAI所研发的一项重要创新,旨在模拟人类的自然语言理解和生成能力,以实现更智能、自然......
  • GPT人工智能模型的应用与优势
    近年来,GPT(GenerativePre-trainedTransformer)人工智能模型成为了人工智能领域的研究热点。GPT是一种基于自注意力机制的深度学习模型,它通过模拟人类的语言逻辑,可以生成高质量的自然语言文本。本文将详细介绍GPT人工智能模型的概念、工作原理以及在现实生活中的应用场景,带领读者了......
  • CHATGPT中文:人工智能如何改变我们的语言和生活
    随着人工智能(AI)的快速发展,CHATGPT中文等自然语言处理领域的技术正在改变我们的日常生活。CHATGPT中文是一种基于深度学习的自然语言生成技术,可以自动生成高质量的中文文本。它在许多领域都有广泛的应用,如智能客服、智能问答、机器翻译、智能写作等。本文将探讨CHATGPT中文的技术原......
  • ChatGPT全称是什么?一文详解chatGPT含义、特点及未来发展
    一、引言近年来,人工智能(AI)技术的迅猛发展为人类生活带来了诸多变革。其中,聊天机器人(Chatbot)作为AI领域的重要应用之一,逐渐融入了我们的日常生活。而在这个领域中,ChatGPT成为了备受瞩目的明星产品。那么,ChatGPT全称是什么?它的含义又是怎样的呢?本文将详细解析ChatGPT的含义、特点以......
  • CHAT GPT 国内版:聊天机器人成为AI领域新宠
    近年来,人工智能(AI)技术发展迅猛,其中自然语言处理领域更是取得了突破性进展。在这个背景下,CHATGPT国内版作为一款基于深度学习的聊天机器人,备受瞩目。本文将围绕CHATGPT国内版展开讨论,分析其在AI领域中的地位和优势,探讨其对于人类社会的影响和前景。一、CHATGPT国内版的背景介绍......
  • GPT之路(四) 神经网络架构Transformer工作原理
     原文:WhatAreTransformerModelsandHowDoTheyWork?Transformer模型是机器学习中最令人兴奋的新发展之一。它们在论文AttentionisAllYouNeed中被介绍。Transformer可以用于写故事、文章、诗歌,回答问题,翻译语言,与人类聊天,甚至可以通过对人类来说很难的考试!但是它们到底......
  • 使用 AutoGPTQ 和 transformers 让大语言模型更轻量化
    大语言模型在理解和生成人类水平的文字方面所展现出的非凡能力,正在许多领域带来应用上的革新。然而,在消费级硬件上训练和部署大语言模型的需求也变得越来越难以满足。......
  • 聊聊ChatGPT
    ChatGPT是一种基于机器学习和自然语言处理技术的聊天机器人,它可以模拟人类对话,回答用户提出的问题或以用户的方式进行对话。ChatGPT的核心是OpenAI的GPT(GenerativePre-trainedTransformer)模型,它是一种预训练的语言模型,可以通过对大规模文本数据进行训练,从而实现对文本的深层理解......
  • 文心一言 VS 讯飞星火 VS chatgpt (81)-- 算法导论7.4 6题
    六、如果用go语言,考虑对PARTITION过程做这样的修改:从数组A中随机选出三个元素,并用这三个元素的中位数(即这三个元素按大小排在中间的值)对数组进行划分。求以a的函数形式表示的、最坏划分比例为a:(1-a)的近似概率,其中0<a<1。文心一言:首先,我们需要实现一个函数来找到数组......
  • 解放双手!ChatGPT助力编写JAVA框架! | 京东云技术团队
    亲爱的Javaer们,在平时编码的过程中,你是否曾想过编写一个Java框架去为开发提效?但是要么编写框架时感觉无从下手,不知道从哪开始。要么有思路了后对某个功能实现的技术细节不了解,空有想法而无法实现。如果你遇到了这些问题,看完这篇文章你也能用ChatGPT编写一个简单的JAVA框架。构思清......