首页 > 编程语言 >大模型和人一样需要 提高对 编程语言认知

大模型和人一样需要 提高对 编程语言认知

时间:2023-09-02 21:56:09浏览次数:54  
标签:编程语言 c# 模型 认知 开源 GPT NET


今天在ChatGLM2-6B 的仓库里看到了这么一个issue: https://github.com/THUDM/ChatGLM2-6B/issues/122

image

这位兄弟说的挺好,其中有点小错误:三星Tizen架构 其实不是架构,是属于arm架构 ,Tizen是 三星的一个操作系统。由此我想到了ChatGLM2 是国人开源的LLM ,因此我去国内的几个大模型应用上面去问问这个问题:

1、科大讯飞的星火大模型:

image

image

看到星火大模型对c# 的认知也是停留在10几年前 ,这和国人对c# 的理解比较接近。 接下来我们去看下百度的文心一言:

image

文心一言也是一样的,这个认知也是停留在10几年前了, 这么看来大模型的认知 受到他的训练者的影响是很大的。 通过这几个国内的大模型可以知道他们的训练数据很差,带满了偏见,对C# 语言的认知还停留在10几年前,下面我们把这个问题问下ChatGPT吧 :

首先问下 GPT-3.5的模型,回答明显比国内这些大模型公正,认知上比较符合事实:

image

image

我们再来用 GPT-4 问一下,回答是正确的:


image

image

从国内外大模型对这么一个简单问题的回答答案来看,国内的这些大模型和 GPT 相比,智商还差得远。 大模型和人一样对这个世界的认知也是有偏差的,喂给她什么知识,他就记住了什么。 马上就要发布.NET 8 的第一个RC版本了, .NET 8带来一个很大特性是NativeAOT, 以后用C# 写的程序,用NativeAOT编译,可以告诉别人说我这程序是C++ 写的, 可以给用Java 通过JNI 来调用。

这个蓝色星球上的C# 语言的采用还是在稳步上升的,Tiobe 的8月份排行榜里,前五名里面只有c# 是在稳步上升,其他的都在下降:

image

今年以ChatGPT为代表的AIGC,微软抓住了, 微软在采用GPT 改造传统应用的过程中开源了一个LLM 开发SDK semantic kernel(简称sk),他的主要语言就是c# , 现在已经支持Java,Python。 SK 经过微软的实践总结,然后在今年的3月份开源,现在已经有star 12k,经过半年时间的社区开源协作,接口逐渐稳定。随着大量企业的GPT 改造浪潮。c# /.NET 会继续上升。

在国内,虽然没有国外那样的上升势头,在国内的很多领域还是非常坚挺的,也有变好的趋势。现在.NET的开源生态已经成熟,剩下就是大家的工程思维和管理思维需要提升,特别是AI领域的算法门槛已经大大的降低,更多的是靠软件工程来补齐,就拿当前在LLM 应用开发领域的两大开发框架 SK 和 langchain来对比,langchain10 几个漏洞,sk没有漏洞。 langchain 是原来搞机器学习算法的人搞的,很多学校里搞算法的博士生算法是厉害,代码基本上不堪入目,使用Python这种胶水代码基本上很难在大并发的工程实践上有什么比用C# 或者Java 好的。现在基于transformer的GPT 模型的落地已经是工程的事情而不仅仅是算法的事情了。

标签:编程语言,c#,模型,认知,开源,GPT,NET
From: https://www.cnblogs.com/shanyou/p/17674268.html

相关文章

  • 什么是敏捷开发中的scrum模型?
    Scrum是一种敏捷软件开发的框架。敏捷开发是一种迭代和增量的开发方法,它强调灵活性、快速反应和客户协作。Scrum特别适合于处理那些需求不断变化,或者不太清楚需求的复杂项目。它是一个轻量级的过程框架,用于管理复杂的创新性工作,它提高了团队之间的沟通和协作......
  • C++程序的内存模型--模型四区
      C++中在程序运行前分为全局区和代码区 代码区特点是共享和只读 全局区中存放全局变量、静态变量、常量 常量区中存放const修饰的全局变量和字符串常量 //栈区//由编译器自动分配释放、存放函数的参数值、局部变量等//注意:不要返回局部变量的地址,栈区开辟的数据由编译器......
  • 从编程语言的角度来理解正则表达式
    程序代码是对现实事物处理逻辑的抽象,而正则表达式,则是对复杂的字符匹配程序代码的进一步抽象;也就是说,高度简洁的正则表达式,可以认为其背后所对应的,是字符匹配程序代码,而字符匹配程序代码,背后对应的是字符匹配处理逻辑。字符匹配处理逻辑,可以抽象为字符匹配程序代码;字符匹配程序代码......
  • Word2Vec模型总结
    1.Huffman树的构造解析:给定n个权值作为n个叶子节点,构造一棵二叉树,若它的带权路径长度达到最小,则称这样的二叉树为最优二叉树,也称Huffman树。数的带权路径长度规定为所有叶子节点的带权路径长度之和。Huffman树构造,如下所示:(1)将看成是有n颗树的森林;(2)在森林中选出两个根节点的权值......
  • 模型评估与选择
    模型评估与选择数据集划分留出法:直接将数据集划分为两个互斥集合K折交叉验证:“交叉验证法”(crossvalidation)先将数据集D划分为k个大小相似的互斥子集,每个子集D都尽可能保持数据分布的一致性,即从D中通过分层采样得到.然后,每次用k-1个子集的并集作为训练集,余下的那个子......
  • COMP 636 BRMM模型算法
    COMP636:PythonAssessmentDue:5pmMonday28August2023Worth40%ofCOMP636gradeSubmitviaAkoraka|LearnIntroductionTheBankside-RakaiaMotorkhanaMavens(BRMM)carclubhasaskedforasystemtohelpmanageitsAugust‘Have-a-goFunMotorkhana’ev......
  • 认知
    专注:高效率的知识获取,通过冥想锻炼。阅读:改变阅读目的,调整心态。计划:拆解目标变得容易,提高积极性。锻炼:提高大脑活跃度,硬件飞升。学习方法:把所得分享出去,记录自己。费曼学习法,我为什么要写博客。思考与改变:思考得与失,复盘一天。......
  • 使用全套开源工具构建 LLM 应用实战:在 Dify 调用 Baichuan 开源模型能力
    背景在当下开源大语言模型火热的背景下,有很大一部分开发者希望本地部署开源LLM,用于研究LLM或者是基于开源LLM构建自己的LLM应用。笔者也正在尝试通过开源社区的一系列相关优秀项目,通过本地化部署服务来构建自己的LLM应用。那么本地部署一个开源LLM来构建一个聊天应用需......
  • 昨日举办亚马逊云科技re:Inforce大会:数据和模型安全是构建AI应用的关键
     8月31日,亚马逊云科技re:Inforce2023中国站首次登陆中国,在北京盛大开启!此次大会以“AI时代全面智能的安全”为主题,聚焦生成式AI在安全层面给企业带来的挑战与机遇。亚马逊云科技认为,安全是构建生成式AI不可回避的重要议题,企业只有在AI旅程中做好数据、模型和应用的安全防护,才能更......
  • Java是一种广泛使用的面向对象编程语言
    Java是一种广泛使用的面向对象编程语言,具有以下特性:平台无关性:Java语言编写的程序可以在不同的操作系统和硬件平台上运行,因为Java语言通过Java虚拟机(JVM)实现了平台无关性。面向对象:Java是一种完全面向对象的编程语言,支持封装、继承和多态等面向对象的基本特性。强类型语言:Java是一......