国产AI发展是百家争鸣还是疯狂内卷（内耗）？

时间：2024-01-19 18:56:42浏览次数：25

标签：百家争鸣框架 AI 学习 pytorch 深度 TensorFlow 内耗

本文纯属闲谈（吐槽）

国外搞深度学习弄出了TensorFlow（编译型）以后推到工业界和学术界，但是由于其不好用（太过于复杂），同一时间另一个框架pytorch（非编译型）。由于pytorch是非编译型的框架，所以可以和python紧密结合，更加pythonic，但是性能与TensorFlow有较大差距，并且不原生支持工业界使用，但是由于其好用（学习时间估计是TensorFlow的十分之一），因此慢慢的pytorch使用的人就多了起来，本来pytorch是作为一个实验型产品的，没想到这么多人用，然后Facebook发现这个是好苗子，于是加大投入，在性能上和工业级支持上追赶Tensorflow，最后在和TensorFlow相差不大的情况下完全淘汰了TensorFlow（估计也就Google自己在用，毕竟Google自己家有TPU）。

可以说，虽然美国当年有两个深度学习框架在竞争，但是毕竟是属于两个设计思路，并且是领域刚兴起的时候，谁也不知道那条路可行，因此也就出现了二者竞争的局面。但是现在再看看国内的深度学习框架，简直是琳琅满目，但凡有些积累的AI公司都要搞自己公司的AI计算框架，弄的最后国产的深度学习框架已经几倍于美国的数量了，但是这事是一件好事嘛，我并不这么看。要知道深度学习框架，国内的设计基本是在学TensorFlow和pytorch的，当然现在还有一个Jax，可以说国内的各厂家的深度学习框架基本属于同质化竞争。其实深度学习框架并没有大家想象的那么难做，就像国产的Linux系统一样，一个中小型的公司就完全可以在一两年的时间内手搓一个出来。深度学习框架也是如此，如果使用NVIDIA的GPU，底层库都是美国做好的，你在上层做好调用，弄好自动微分的前向和后向模式，在把基本的CNN、RNN、Attention等kernel函数包装一下，这个深度学习框架也就出来了，这也是为啥和TensorFlow、pytorch同一时间出现的众多美国的开源深度学习框架一样，如果你的编程能力比较OK，你甚至可以手搓一个toy版本的深度学习框架。

其实，重点并不在于深度学习框架具体用哪种方式实现，而是在于如何能使其运算性能更高，更稳定，更易用，有更多的社区用户支持，背后的企业是否能有足够的投资进行维护和升级。国内搞出这么多深度学习框架，就和高校科研所发论文一样，就是为了发而发，就和申请基金和专利一样，你也不要管它好用不好用，反正报上去就能算业绩，来年好评正高级。如果企业也这么高，我想着不是百家争鸣，而是内耗。这么多企业把资金和精力都投入到相同的工作上，最后估计就看哪家企业先放弃。各家AI企业应该搞差异化的工作，而不是搞同质化的工作，就比如搞大语言模型，全国各家AI企业也都是一家搞一个，结果搞出了几百个大模型，我就在想，最后有几个人会使用这几百个大语言模型，又有几个人会去使用国内那么多的深度学习框架。不要忘记，国内的这几百个大语言模型都没有赶上openai的那一个好用，国内的那些数不尽的深度学习框架最后在GitHub上可以看到的项目最终还是pytorch和TensorFlow的。

国产AI发展的内耗我想是短时间内难以终结的，我想最终就要看谁真的能强起来，把其他家都甩在后面，这样其他的企业估计就放弃搞这些同质化的开发了。这就和中国古代的春秋战国一样，最后只有一家实力远超其他家，这个局面才会统一。

PS. 国产的那些深度学习框架，我只用过mindspore，因为只有他家有能力设计芯片并制作芯片（国内代工），而且也只有这家有足够的经济基础，虽然这家是搞销售起家后来以硬件设计著称的，但是这种内卷竞赛玩到最后就是看谁有钱，谁能挺得住，所以我押宝就压这个mindspore了，至于其他国产深度学习框架，那是真的没精力去了解了，太多了，我就用个CNN和RNN，搞出这么多框架，太吓人了，毕竟这个深度学习框架和大语言模型说的再多其本质也无非只是工具，既然手头上有一个好用的锤子了为啥还要研究出那么多长相不同的锤子了，毕竟这东西是用来使用的，而不是用来申请专利的（内涵一下，哈哈哈），不是多多益善，而是好用就够。

标签：百家争鸣,框架,AI,学习,pytorch,深度,TensorFlow,内耗
From： https://www.cnblogs.com/devilmaycry812839668/p/17975369

【测试自动化覆盖率】记录统计自动化的工具testrail 如何实现自动统计覆盖率
点击编辑来到这个页面点击自己想要统计的testplan里面的用例选择selectcases 先选择右边的过滤所有Automated 为yes的tag，然后在底下点击确定在左边呈现的就是出现的取消不要的用例 ......
Altair SimSolid 工程仿真软件衡祖仿真
AltairSimSolid是一款基于新型计算技术的结构模拟软件，它采用了一种全新的有限元分析方法，可以快速、准确地模拟大型装配体的结构响应和特性，无需进行网格剖分和几何简化。此外，SimSolid还可以处理不同类型的材料、不同类型的接触、非线性材料行为和大变形等问题。SimSolid还具有易于......
Hive报错：Call From hadoop01/172.23.238.2 to hadoop01:10020 failed on connection e
问题描述在阿里云服务器上安装的Hadoop和Hive，刚开始关闭了防火墙。但是由于服务器被被黑客安装挖矿程序，所以开启了防火墙。但是即使开启了所有可能的端口，但是在向Hive中插入数据时，依然报错提示：CallFromhadoop01/172.23.238.2tohadoop01:10020failedonconnectionexception......
快速玩转 Mixtral 8x7B MOE大模型！阿里云机器学习 PAI 推出最佳实践
作者：熊兮、贺弘、临在Mixtral8x7B大模型是MixtralAI推出的基于decoder-only架构的稀疏专家混合网络（Mixture-Of-Experts，MOE）开源大语言模型。这一模型具有46.7B的总参数量，对于每个token，路由器网络选择八组专家网络中的两组进行处理，并且将其输出累加组合，在增加模型参数总量的同时，优......
使用AI来写PPT
最近工作中经常会写各种各样的ppt，选版图选格式，写文字非常费时。发现一款协助写ppt的服务，对不喜欢写ppt的人非常友好，如果对效果要求不高，基本1分钟一个成品ppt。Aippt网址：https://www.aippt.cn/一、进入选择二、选择智能生成ppt三、如果有word的提纲（也就是所谓的目录）就选择导......
CES 2024：芯片厂商集体奔向AI，汽车芯片成为新赛道
一年一度的CES又来了！美国当地时间1月9日，2024年国际消费类电子产品展览会（CES）如期举行。作为全球最盛大的科技盛会，全球多个行业的顶尖企业都会参加CES。今年，展商们已经不约而同将主题放在了AI上。在CES2024上，可以看到许多关于人工智能、硬件创新、智能家居、汽车科技、虚拟现实、增......
科技云报道：“存算一体”是大模型AI芯片的破局关键？
在AI发展历史上，曾有两次“圣杯时刻”。第一次发生在2012年10月，卷积神经网络（CNN）算法凭借比人眼识别更低的错误率，打开了计算机视觉的应用盛世。第二次是2016年3月，DeepMind研发的AI程序AlphaGo，战胜世界围棋冠军李世石，让全世界惊叹于“人工智能”的实力。这两次“圣杯时刻”的幕后，都有......
解决npm run start 和 node.js src/main.js 引用资源文件路径不一致问题
解决npmrunstart和node.jssrc/main.js引用资源文件路径不一致问题问题描述写了一个node.js连接sqlite3数据库的项目，因为数据库sqlite3.db文件相对于根目录和src/main.js路径不一致，打包时总有一种方法失败分析原因数据库sqlite3.db文件是相对控制台运行命令的相对路径npmrun......
首个！百度飞桨会客厅落地广州，打通AI应用落地的“最后一公里”
2023年，在大模型的浪潮下，各行各业使用AI技术的门槛被进一步降低，为AI技术创新广泛赋能产业发展提供了基础。百度依托全栈式的AI技术产品优势，推动AI产业人才培养，建设繁荣技术生态，加速AI技术在产业的规模应用。广州是国家人工智能创新应用先导区，百度AI技术生态已累计服务广州企业7747家......
[论文阅读] Progressive Domain Expansion Network for Single Domain Generalization
ProgressiveDomainExpansionNetworkforSingleDomainGeneralization3.Method本文提出的PDEN用于单域泛化。假设源域为\(\mathcal{S}=\left\{x_i,y_i\right\}_{i=1}^{N_S}\)，目标域为\(\mathcal{T}=\left\{x_i,y_i\right\}_{i=1}^{N_T}\)，其中\(x_i,y_i\)分别表示第......

国产AI发展是百家争鸣还是疯狂内卷（内耗）？

相关文章

赞助商

阅读排行