讯飞星火大模型与New Bing实测对比

时间：2023-05-07 10:12:03浏览次数：55

昨天科大讯飞发布了讯飞星火认知大模型，在发布会现场实测大模型的7种核心能力，并发布了它在教育、办公、汽车、数字员工领域的应用成果。科大讯飞董事长刘庆峰表示：认知大模型展示了通用人工智能的曙光，讯飞星火认知大模型已在文本生成、知识问答、数学能力3种能力上超越ChatGPT。

NewBing 也全面开放给用户，我参考光哥的《ChatGPT与New Bing实测对比，New Bing真的是采用GPT-4吗？》文章中的三个推理能力测试进行了对比检测。

New Bing新必应
讯飞星火大模型

通过几个Prompt的测试，讯飞星火大模型输出结果与New Bing的结果差远了，3道题全部错误，光哥文章中已经总结了结论，New Bing用的模型应该是ChatGPT 3.5。

问题1：一艘船10天可以渡过太平洋，请计算10艘船多少天可以渡过太平洋。

讯飞星火大模型：错误

New Bing：正确

问题2：假设树上有10只鸟，猎人开枪打死一只，请计算树上还剩下几只鸟？

讯飞星火大模型：错误

New Bing：错误

问题3：我爸妈结婚的时候为什么不邀请我

讯飞星火大模型：错误

New Bing：错误

讯飞星火大模型在推理能力上相比ChatGPT 还差很远，他们的目标：我们计划今年10月底整体赶超ChatGPT。到时继续测试这三个问题来检测，期待他们能够去实现这一目标。

标签：10,Bing,星火,New,ChatGPT,模型
From： https://www.cnblogs.com/shanyou/p/17378930.html

CF750E - New Year and Old Subsequence
题意：给一个字符串，每次询问它的一个区间，问最少删除多少个字符，使得区间没有子序列2016，但是有子序列2017。Mysolution首先考虑贪心，通过预处理的方式找到区间最后一个7，依次往前贪心的找到最靠后的一组2017。接下来，我们需要7的后面没有6，7前面的部分不能组合出2016。我们先......
ChatGPT有门槛？微软NewBing全面开放
最近微软毫无征兆的宣布BingChat全面开放，人人可用！大家都知道ChatGPT得使用门槛很高，而BingChat底层调用的是GPT4.0的模型，这无疑是体验GPT4.0最简单的姿势了，无需任何等待。只需注册一个账户，首页即可体验。让我们一起体验看看吧，打开微软必应首页，点击上面的聊天按钮，就进入了必应的智......
Bing的AI聊天使用体验
Bing开启了AI聊天功能，我们这里做一个简单的测评，看看各种AI是否达到预期效果。PS：没有“魔法”的各位就不用看下去了1.登陆打开edge，遇到的第一个问题就是，使用“魔法”后，登陆报错0x80190001（不登录每天的聊天次数有限）搜索资料后发现一个好用的解决方式，下载fiddler,打开win......
Hugging News #0506: StarCoder, DeepFloyd/IF 好多新的重量级模型
每一周，我们的同事都会向社区的成员们发布一些关于HuggingFace相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「HuggingNews」，本期HuggingNews有哪些有趣的消息，快来看看吧！StarCoder:最新的代码生成LLMBlog:ht......
关于Class.forName(className).newInstance()介绍
Class.forName(xxx.xx.xx) 返回的是一个类首先你要明白在java里面任何class都要装载在虚拟机上才能运行。这句话就是装载类用的(和new 不一样，要分清楚)。至于什么时候用，你可以考虑一下这个问题，给你一个字符串变量，它代表一个类的包名和类名，你怎么实例化它？只有你提到的这个方......
mv: cannot move '/usr/local/lib/R/site-library/00LOCK-Biobase/00new/Biobase' to
01、安装Biobase 包的时候遇到如下问题mv:cannotmove'/usr/local/lib/R/site-library/00LOCK-Biobase/00new/Biobase'to'/usr/local/lib/R/site-library/Biobase':Permissiondenied 02、解决方法在R终端执行如下命令：Sys.setenv(R_INSTALL_STAGED=FALSE)......
Codeforces 908H - New Year and Boolean Bridges（FWT）
一道挺有意思的题，并且感觉有点诈骗的成分在内（首先考虑分析三种字符的性质：显然任意两点\(i,j\)之间要么\(i\)可以到达\(j\)，要么\(j\)可以到达\(i\)，否则AOX三个一个都不能满足。如果两点间的状态是A，那么这两点必须在同一强连通分量内。如果两点间的状态是X，那么这......
django.core.exceptions.ImproperlyConfigured: mysqlclient 1.4.3 or newer is requi
1、在项目中__init__.py中这个报错原因，python3.5以上版本不支持这种方式frompymysqlimportinstall_as_MySQLdbinstall_as_MySQLdb()解决：importpymysqlpymysql.version_info=(1,4,3,"final",0)#指定了pymysql的版本：1.4.3,按照你版本修改pymysql.install_as_MySQLdb()......
实例化对象 A a = new A();
"new"在Java中代表实例化的意思,Aa=newA()代表实例化了一个对象a,这个对象a属于A类.可以认为A是一个抽象概念,对象a是一个实体(存储于内存),等式左边实际上就是用类A定义对象a,等式右边就是创造对象a的过程.Aa; 是定义一个类型为A的对象。new实例化a=n......
Elasticsearch专题精讲——What's new in 8.7?
What'snewin8.7?https://www.elastic.co/guide/en/elasticsearch/reference/8.7/release-highlights.html，ortherversions：8.6 | 8.5 | 8.4 | 8.3 | 8.2 | 8.1 | 8.0Timeseries(TSDS)GA(时间序列)TimeSeriesDataStream(TSDS)isafeatureforoptimi......

讯飞星火大模型与New Bing实测对比

相关文章

赞助商

阅读排行

讯飞星火大模型 与New Bing实测对比

相关文章

赞助商

阅读排行

讯飞星火大模型与New Bing实测对比