据可靠内部消息,微软正积极筹备一场新的技术革命,那就是启动下一代操作系统的研发计划,这将再次展现其作为科技巨头的雄心和实力。
与面向C端的Windows个人电脑操作系统不同,微软的新操作系统,是面向B端的操作系统,目标指向是AI算力集群和云计算平台。首先会在“星际之门”项目上应用,成为通用人工智能GPT-6的软件基础平台,待产品完善后,慢慢切换到Azure云计算平台,取代目前Azure云使用的Linux操作系统。后续,微软新一代操作系统,将以商品形式向市场发售,发售对象是云计算企业、算力中心、私有云客户、超算、政府、科研及军事部门,但是不包括中国市场。
根据已有的一些信息,微软下一代操作系统,与LAXCUS分布式操作系统有很多相似之处。微软能够投入巨资研发新操作系统,应该是看到算力产业巨大的发展潜力和商业价值。凭借其深厚的技术积累和广泛的用户基础,微软下一代操作系统将更为强大和灵活。
微软在PC时代辉煌过,但是在移动互联网时代落伍了,后来凭借云计算和AI,重新站在产业市场前列。研发面向AI算力集群和云计算平台的新一代操作系统,显然是想夯实他在AI和算力市场的领导地位。
未来20年,是AI驱动下的算力时代。算力将成为一种重要的基础资源,必然深处社会各个领域,如何更好地管理算力、使用算力、节约算力,是亟待解决的问题。
做过研发的都知道,技术问题,如果能够从底层解决,要比从应用层解决效率更高,并且更稳定更可靠,也更容易实现标准化和通用化。
做为操作系统行业资深大佬的微软,显然非常明白这些情况。参考Windows的发展历程,通过操作系统辐射相关应用产业,占领产业制高点,通吃整个软件产业链,是微软一贯做法。
以微软的技术实力和商业能力,一旦完成新一代操作系统研发,投入市场后,B端软件市场将面临重新洗牌的局面,很多企业应用将面临下课的风险。市场将从现在的群雄并起、诸候争据,变成一家独大。进一步,届时微软凭借B端C端两大操作系统,完成计算机B端C端的深度整合,将再一次站在软件世界之巅,成为计算机产业当之无愧的王者,世界将再次匍匐在他的脚下,微软将再次复现PC时代的辉煌。
目前微软的新一代操作系统尚处于产品研发阶段,但是它与LAXCUS分布式操作系统目标一致,应用方向相同,所以技术和功能应该也大差不差。这里暂且以LAXCUS分布式操作系统7.0版本为样板,反向推演微软新一代操作系统1.0的大致轮廓。
一、产品定位
从物理形态来说,微软新操作系统属于多机操作系统,与LAXCUS分布式操作系统一致,但是与单机操作系统有本质区别。多机操作系统主要运行在云计算平台和计算机集群上,管理和调度海量的计算机资源,旨在解决大规模、超大规模分布式计算和分布式存储遇到的算力瓶颈问题。所以,无论是数据处理、实时分析、AI模型训练,都是微软新操作系统拿手好戏。凭借海量的硬件算力资源,结合软件的系统函数库,它能够用更短的时间,实现更快更强的计算效果,这也是多机操作系统的产品属性和商业价值所在。
技术是相通,如果估算不错的话,微软新操作系统能够支持的计算机规模上限,应该与LAXCUS分布式操作系统类似。在IB网络环境下,单集群模式能够达到8000至10000个节点,多集群模式,可以超过100万节点。这个支持能力,将为微软的“星际之门”项目和Azure云计算平台提供有效基础算力保障。
同样的,在中国,LAXCUS分布式操作系统也可以将全国算力中心连接起来,形成“全国算力一张网”,集中管理调度,为企业提供更好的算力服务。
二、资源聚合
对计算机集群的资源聚合能力,肯定也是微软新操作系统的基本功能之一。所谓资源聚合,就是通过网络,将分散的物理计算机节点连接起来,成为一个集中的虚拟超级计算机。无论物理上有多少台计算机,在软件层面,都是一台逻辑透明的“单机运行环境”,基于此,微软新操作系统将实现计算资源的集中管理、高效利用、无缝计算服务。同时,基于资源聚合的逻辑透明的“单机运行环境”,也将大幅简化应用软件的开发流程,降低开发难度,使开发者像编写单机应用软件一样,开发出具备超大规模计算能力的分布式应用软件。这对当下复杂的AI、大数据、HPC开发工作来说,是一个巨大的福音。
参考LAXCUS分布式操作系统,微软新操作系统的资源聚合,硬件包括:CPU、GPU、磁盘、内存、网络等。软件的资源聚合,将由操作系统和系统函数库(在LAXCUS分布式操作系统是DSDK)提供,操作系统运行过程中,以软件接口形式交付给应用软件使用。
三、云管能力
云管能力应该也是微软新操作系统的又一重要基本功能。通过内置的云管理工具,用户可以方便地部署、监控和管理计算集群,实现对计算资源的实时掌控。微软新操作系统很可能提供云管API,并完成云管标准化。如果情况属实,那么微软凭借新操作系统,将吃下又一个企业应用市场,届时很多云管应用软件将面临下课风险,这是相关从业者需要警醒的。
四、虚拟化
虚拟化是资源聚合的反向动作,能够将一台物理计算机中划分成多台虚拟计算机,分配给用户使用,从而达到资源复用、降低使用成本的目的。所以虚拟化也应该是微软新操作系统的核心功能之一。通过多种虚拟化技术,包括容器化、虚拟机等,能够为用户提供灵活多样的计算环境。无论是开发、测试还是生产环境,用户都可以根据自己的需求选择合适的虚拟化方案,快速创建和管理虚拟机或容器,实现计算资源的灵活分配和管理。
目测,虚拟化将是微软新操作系统的一个选件。因为像“星际之门”这样的算力集群,更多是对算力的渴求,而对虚拟化需求并不强烈,虚拟化更适合Azure这样的云计算平台和云计算服务企业。
微软如果将虚拟化功能集成进入他的新一代操作系统,通过操作系统辐射应用市场,必然会对其它虚拟机厂商形成冲击,比如VMWare、OpenStack等虚拟机厂商。具体参考微软和网景的浏览器大战。
五、冗余容错
计算机集群是由大量计算机通过网络连接起来的物理环境。它在运行过程中,无法保证每个节点都处于正常运行状态,促使冗余容错机制是所有分布式系统必须具备的基础能力。所以可以肯定的是,为了保证计算机集群运行环境整体的稳定性和可靠性,微软新操作系统一定会采用各种各样的冗余容错技术,确保服务的连续性和可用性。
通常一个简单的冗余容错流程是:操作系统保持对所有计算机的追踪,一旦发现并判断是某个节点出现故障,立即启动备份节点,替换故障节点,并根据冗余记录,将相关业务迁移到新的正常节点运行,并隔离故障节点,然后将上述信息报告给系统管理员。
实际的冗余容错机制非常多,也更复杂,比如时间冗余、空间冗余、信息冗余、回滚容错、TRM容错、灾难恢复等,确保系统在面对硬件故障或者外部攻击时能够保持正常运行。
近年来,由于AI技术突飞猛进,冗余容错引入了AI元素,比如LAXCUS分布式操作系统采用的自适应机制和智能感知技术,它们在强化操作系统对计算机集群的自动化管控、减少人力干预、降低运维成本时作用明显。
六、安全
现在,系统安全已经是所有操作系统的基础功能,所以微软新操作系统应该也会安全方面下足了功夫,比如加密技术和访问控制策略,从而确保用户数据的安全性和隐私性。另外,微软新操作系统应该也会内置一些安全工具和机制,如防火墙、入侵检测等,为用户提供全方位的安全保障。
所以,从事相关研发的企业也要小心了,微软新操作系统会吃掉你们的市场。
七、分布式编程接口
微软新操作系统的又一个核心重要组成部分是分布式编程接口,与之对应,在LAXCUS分布式操作系统是DSDK。只有提供了分布式编程接口,开发者才能编写基于微软新操作系统的应用软件。如果微软实现这样的开发框架,且且应用生态成型,类似Slurm这样的分布式编程框架也要下课了,微软将吃下又一个企业市场。
八、分布式应用软件
当新操作系统和分布式编程接口成型,微软的工作重心肯定将转向分布式应用软件,并通过分布式应用软件构建应用生态。不同传统单机操作系统上的应用软件,运行新操作系统上的应用软件,将更多是企业应用软件。这些企业软件以算力需求庞大、计算能力强大著称。比如大规模的数据计算、数据分析、机器学习等工作。
因为多机操作系统不同于单机操作系统,分布式应用软件也与单机应用软件不同。以LAXCUS分布式操作系统为例,分布式应用软件将分为前端和后端两个部分。其中前端将主要负责人机交互工作,后端分散在计算机集群上运行,提供大规模、超大规模的计算和存储支撑。前后端相互作用,共同组织实施大型计算任务,比如AI训练、分子模拟、流体力学、结构力学、高端武器仿真测试等工作。
微软大概率会为分布式应用软件构建一个类似App Store 的应用商店,辅助完成生态建设,实现开发者和用户的链接、交流、交易。
九、对AI的支持
作为面向AI算力集群的操作系统,微软新操作系统一定会深度支持AI。可能的做法是在操作系统中内置了AI算法和框架,如TensorFlow、PyTorch等,这将方便用户进行模型训练和推理。同时,微软新操作系统还将支持GPU加速、分布式训练等先进技术,为AI应用提供强大的算力支持。
为节约AI算力能耗和GPU使用规模,目前英伟达已经联合了Transformer研发团队,重构AI大模型的软件基础框架。因为AI大模型软件基础框架的重要性,与以前开源开放不同,这一次他们不开源了。在AI领域不肯掉队的微软,应该也有类似的打算。
十、兼容Windows
为了保持用户的使用习惯和避免用户流失,微软的新操作系统一定会兼容现有的Windows平台,使得企业用户可以无缝迁移到新系统,继续使用他们熟悉的Windows应用和服务,比如像SQL Server这样的企业应用软件。而且微软为提高新操作系统的覆盖面和产业生态,很可能会向使用Windows Server的企业推荐新操作系统,以取代Windows Server。无论是计算性能和计算规模,微软新操作系统都远胜Windows Server。
十一、生态
生态建设肯定是微软最重注的环节,这事关微软新操作系统能够走多远。产品层面的做法应该是开放API、提供开发工具、技术支持等方式,吸引开发者和企业加入其生态体系,实现云计算、AI、算力应用业务的标准化和通用化,就像苹果iOS和谷歌Android曾经做过的那样。
最近一段时间,美国一批高科技公司,包括微软、苹果、谷歌、Meta、特斯拉、亚马逊、甲骨文正在大量囤积英伟达算力芯片。硬件算力基础设施,除了微软的“星际之门”,特斯拉也升级了他的Grok超级计算机,马斯克将其称为“超级算力工厂”。这些硬件算力基础设施,如果再配合微软的新一代操作系统,结合新的Transformer框架,以及GPT-6、Llama3等通用人工智能大模型,他们已经为即将到来的通用人工智能产业大爆发做好准备,再一次站在世界的前列!
结束语
目前微软新一代操作系统尚未出炉,具体的技术和功能仍有变数,但是总体的技术框架和应用方向不会有变化。
微软的野望,凭借新一代操作系统再一次展现得淋漓尽致,一旦完成下一代操作系统和AI产业布局,微软很可能成为全球第一个突破5万亿美元的超级公司。
在AI时代,微软通过从AI应用、AI通用大模型、AI算力基础设施、AI操作系统的谋篇布局,正在重构AI软硬件市场,再一次展示了强大的技术和产业实力。而我们已经严重落后。
但是,给予我们压力的不只是微软,我们还面临国外政府和一众高技术企业,从硬件到软件的全面围堵和降维打击。在此希望国内的企业和职能部门,多关注全球科技前沿动向,重视国内AI投融资市场和软硬件生态建设,多做点实事,不要在无谓的抄袭、炒作、弯道超车宣传中渡过。
与诸群共勉!
标签:操作系统,微软,AI,野望,软件,算力,分布式 From: https://www.cnblogs.com/laxcus/p/18218658