首页 > 其他分享 >初创芯片公司非常疯狂,将CPU性能提高100倍

初创芯片公司非常疯狂,将CPU性能提高100倍

时间:2024-07-10 12:59:07浏览次数:13  
标签:芯片 性能 Flow 初创 PPU 100 CPU

初创芯片公司非常疯狂,将CPU性能提高100倍


  • [http://mp.weixin.qq.com/s?__biz=Mzg2NDgzNTQ4MA &mid=2247741576&idx=5&sn=733a2dffecbfd99e41e97e93e204b2cb&chksm=ce6e327ff919bb691bf4e3ed418f27d816846b1c577477d5d7f063c103e01d9d4cbeca47195b&mpshare=1&scene=1&srcid=0618nw6bFeoC1LZrnXPq2mEi&sharer_shareinfo=672fdb5b9c26da37690b782498b00164&sharer_shareinfo_first=672fdb5b9c26da37690b782498b00164#rd - 微信公众平台](http://mp.weixin.qq.com/s?__biz=Mzg2NDgzNTQ4MA &mid=2247741576&idx=5&sn=733a2dffecbfd99e41e97e93e204b2cb&chksm=ce6e327ff919bb691bf4e3ed418f27d816846b1c577477d5d7f063c103e01d9d4cbeca47195b&mpshare=1&scene=1&srcid=0618nw6bFeoC1LZrnXPq2mEi&sharer_shareinfo=672fdb5b9c26da37690b782498b00164&sharer_shareinfo_first=672fdb5b9c26da37690b782498b00164#rd)
  • 半导体行业观察:一家名为Flow Computing的芬兰初创公司做出了硅工程领域有史以来最疯狂的宣言之一:通过添加其专有的配套芯片,任何 CPU 都可以立即将其性能提高一倍,通过软件调整可以将性能提高 100 倍。
  • 2024-06-18 20:52:43

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容由半导体行业观察(ID:icbank)编译自techcrunch,谢谢。

一家名为Flow Computing的芬兰初创公司做出了硅工程领域有史以来最疯狂的宣言之一:通过添加其专有的配套芯片,任何 CPU 都可以立即将其性能提高一倍,通过软件调整可以将性能提高 100 倍。

如果成功的话,它可以帮助行业满足人工智能制造商永不满足的计算需求。

Flow 是芬兰国家研究机构VTT的子公司,VTT 有点像国家实验室。它正在商业化的芯片技术被称为并行处理单元,是该实验室研究的成果(尽管 VTT 是投资者,但知识产权归 Flow 所有)。

Flow 首先承认,这种说法从表面上看是可笑的。你不可能只是神奇地从不同架构和代码库的 CPU 中榨出额外的性能。如果是这样,英特尔或 AMD 或其他公司几年前就做到了。

但 Flow 一直在研究一些理论上可行的东西-只是没有人能够实现它。

中央处理器自真空管和穿孔卡诞生以来已经取得了长足的进步,但从根本上讲,它们仍然是一样的。它们的主要限制是,作为串行处理器而非并行处理器,它们一次只能做一件事。当然,它们每秒在多个核心和路径上切换这件事数十亿次——但这些都是适应 CPU 单通道特性的方法。(相比之下,GPU 可以同时进行许多相关计算,但专门从事某些操作。)

“CPU 是计算中最薄弱的环节,”Flow 联合创始人兼首席执行官 Timo Valtonen 表示。“它无法胜任自己的任务,这一点需要改变。”

CPU 的速度已经非常快,但即使具有纳秒级的响应速度,在执行指令时仍会造成大量浪费,这仅仅是因为一个任务需要先完成,然后才能开始下一个任务这一基本限制。(我在这里只是简化了一下,因为我自己并不是芯片工程师。)

Flow 声称已经消除了这一限制,将 CPU 从单车道街道变成了多车道高速公路。CPU 仍然只能一次执行一项任务,但 Flow 的 PPU(他们称之为 PPU)本质上可以在片上执行纳秒级的流量管理,以比以前更快的速度将任务移入和移出处理器。

想象一下 CPU 就像厨房里的厨师。厨师的工作速度是有限的,但如果有一个超人助手在厨师手中更换刀具和工具、清理准备好的食物并添加新配料、删除所有不属于厨师实际工作的任务,情况会怎样?厨师仍然只有两只手,但现在厨师的工作速度可以提高 10 倍。

640

这不是一个完美的类比,但它能让你了解这里发生的事情,至少根据 Flow 的内部测试和与业界的演示(他们正在与所有人交谈)。PPU 不会增加时钟频率或以其他方式推动系统,从而导致额外的热量或功率;换句话说,厨师并没有被要求以两倍的速度切菜。它只是更有效地利用了已经在进行的 CPU 周期。

Valtonen 说,这种事情并不新鲜。“学术界已经对此进行了研究和讨论。你已经可以进行并行化,但它会破坏遗留代码,然后就没用了。”

所以这是可以做到的。如果不从头开始重写世界上所有的代码,就无法做到这一点,这在某种程度上使它成为不可能实现的。另一家北欧计算公司 ZeroPoint解决了类似的问题,该公司实现了高水平的内存压缩,同时保持了数据与系统其余部分的透明性。

换句话说,Flow 的重大成就不是高速流量管理,而是无需修改已测试的任何 CPU 或架构上的任何代码即可实现高速流量管理。除了将 PPU 与芯片集成之外,无需修改,任何芯片上的任意代码都可以以两倍的速度执行,这听起来有点不合常理。

这正是 Flow 成功的主要挑战:与软件产品不同,Flow 的技术需要包含在芯片设计层面,这意味着它不能追溯,而第一款带有 PPU 的芯片必然要经过相当长一段时间才能问世。Flow 已经证明该技术在基于 FPGA 的测试设置中是有效的,但芯片制造商必须投入大量资源才能看到收益。

不过,这些改进的规模,以及过去几年 CPU 改进的迭代和小规模,可能会让这些芯片制造商迫切地寻求 Flow 的帮助。如果你真的可以通过一次布局更改在一代中将性能提高一倍,那就不难了。

通过重构和重新编译软件,使其与 PPU-CPU 组合更好地协同工作,性能将进一步提升。Flow 表示,通过修改代码(尽管不一定完全重写)以利用其技术,性能提升了 100 倍。该公司正在努力提供重新编译工具,让想要针对支持 Flow 的芯片进行优化的软件制造商更轻松地完成这项任务。

Tirias Research的分析师 Kevin Krewell在听取了 Flow 的技术介绍后,被认为是这些问题的外部人士,他更担心行业吸收而不是基本面。

他非常正确地指出,AI 加速是目前最大的市场,可以通过 Nvidia 广受欢迎的 H100 等特殊芯片瞄准这一市场。尽管 PPU 加速 CPU 会带来全面收益,但芯片制造商可能不想让局面过于动荡。问题在于,这些公司是否愿意将大量资源投入到一项未经证实的技术中,而他们的五年计划可能会因这一选择而受到干扰。

Flow 的技术是否会成为每家芯片制造商的必备组件,从而让其一夜暴富、声名鹊起?还是精打细算的芯片制造商会决定坚持下去,继续从稳步增长的计算市场中赚取利润?可能介于两者之间——但这说明,即使 Flow 在这方面取得了重大的工程成就,但与所有初创公司一样,该公司的未来仍取决于其客户。

Flow Computing借助 CPU 性能增强技术脱颖而出

Flow Computing是向所有架构的 CPU 供应商授权片上超高性能并行计算解决方案的先驱,今天,该公司宣布从多家北欧风险投资公司和商业实体获得总计 400 万欧元的种子前融资。

Flow 能够集成到任何 CPU 设计架构、指令集或工艺几何中,提供革命性的 100 倍加速,可立即用于基于冯·诺依曼的标准计算机设计,以实现“CPU 2.0”级别的吞吐量。Flow 还消除了高性能应用程序中对昂贵的 GPU 指令加速的需求。

Flow 的突破性新架构称为并行处理单元 (PPU),通过获得 Flow 的许可,通过片上集成的 PPU 将 CPU 性能提升了 100 倍。PPU 与该 CPU 架构的每个现有软件应用程序完全向后兼容 - 所有现有软件和应用程序中的现有并行功能都可以通过为 PPU 重新编译而大大加速,而无需进行任何软件更改。

芯片上集成的 PPU 核心越多,随后获得的性能提升就越高,Flow 已针对 CPU 市场应用的每个主要层级(移动、PC 和超级计算机)优化了许可证。Flow 的技术在本质上也与整个设备主板以及任何外围板相辅相成——在提升 CPU 性能的同时,所有其他连接单元(如矩阵单元、矢量单元、NPU 和 GPU)都从 PPU 的性能中获益,并从现在功能更强大的 CPU 中获得重大提升。

Flow 已经与全球主要半导体供应商进行初步讨论,寻求下一代 CPU 性能的“圣杯”——更多技术细节将于 2024 年下半年公开分享。

Flow 种子轮前融资的参与实体包括 Butterfly Ventures(领投 VC)、FOV Ventures、Sarsia、Stephen Industries、Superhero Capital 和 Business Finland。作为芬兰著名技术研究中心 VTT 的衍生公司,VTT 持有 Flow Computing 的股权,在此期间,其数年开发的所有专利 IP 都已正式转让给 Flow。

Flow Computing 联合创始人兼首席执行官 Timo Valtonen 表示:“我们坚信,在过去的几十年里,CPU 性能只取得了渐进式的提升——我们认为,这导致了这样一种情况:由于其次优的顺序架构,CPU 实际上已成为计算中最薄弱的环节。”

“为了满足对更高计算性能不断增长的需求,开启 CPU 性能的新时代已成为必然,而这种需求在很大程度上是由人工智能以及边缘和云计算的需求所驱动的。Flow 打算通过其全新的并行性能单元 (PPU) 架构引领 SuperCPU 革命,无论架构如何,都能将任何 CPU 的性能提高 100 倍,并具有完全的向后软件兼容性。”

“在芬兰,Flow Computing 的技术创新让我们感到兴奋不已,因为芬兰正努力成为世界领先的尖端半导体设计出口国。他们不仅为 CPU 供应商提供了完整的性能生态系统,还为围绕 X86、Apple M 系列、Exynos、ARM 和 RISC-V 等主要 CPU 设计的开发社区提供了完整的性能生态系统。我们很高兴 Flow 在 VTT 开发的技术不仅能够为芬兰和欧洲计算生态系统做出重大贡献,而且能够为整个计算行业的未来做出贡献!”VTT 首席执行官 Antti Vasara 说道。

参考链接

https://techcrunch.com/2024/06/11/flow-claims-it-can-100x-any-cpus-power-with-its-companion-chip-and-some-elbow-grease/?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAG0cZhpQNwceFZUMJ6BvtTq_fahfFm30HXtFkiTUO7nDRm_-SS3C__uCMDFZN-qkpZqtHJ0Blofo5TAq8E6GXKl9wJIGx73ZH1vqzLH50HdNgGJOfjoaMvS9BBHaVL5lzLHH0qUIoxRGAg7KFQLCy4BLUiNrho9lPHJI-LOfPs0g

点这里加关注,锁定更多原创内容

END

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

640

今天是《半导体行业观察》为您分享的第3794期内容,欢迎关注。

推荐阅读

EUV光刻机重磅报告,美国发布

碳化硅“狂飙”:追赶、内卷、替代

芯片巨头,都想“干掉”工程师!

苹果,玩转先进封装

GPU的历史性时刻!

大陆集团,开发7nm芯片

★张忠谋最新采访:中国会找到反击方法

EUV光刻的新“救星”

640

640

640

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点 “在看” 分享给小伙伴哦640

640

标签:芯片,性能,Flow,初创,PPU,100,CPU
From: https://www.cnblogs.com/readdad/p/18293837/the-start-up-chip-company-is-very-crazy-increas

相关文章

  • 初创芯片公司非常疯狂,将CPU性能提高100倍
    初创芯片公司非常疯狂,将CPU性能提高100倍[http://mp.weixin.qq.com/s?__biz=Mzg2NDgzNTQ4MA&mid=2247741576&idx=5&sn=733a2dffecbfd99e41e97e93e204b2cb&chksm=ce6e327ff919bb691bf4e3ed418f27d816846b1c577477d5d7f063c103e01d9d4cbeca47195b&mpshare=1&scene=......
  • 利用SpringBoot+rabbitmq 实现邮件异步发送,保证100%投递成功
    在之前的文章中,我们详细介绍了SpringBoot整合mail实现各类邮件的自动推送服务。但是这类服务通常不稳定,当出现网络异常的时候,会导致邮件推送失败。本篇文章将介绍另一种高可靠的服务架构,实现邮件100%被投递成功。类似的短信自动发送等服务也大体相同。一、先来一张流程图......
  • 代码随想录算法训练营第57天 | 99.岛屿数量 深搜 、99.岛屿数量 广搜 、100.岛屿的最
    99.岛屿数量深搜注意深搜的两种写法,熟练掌握这两种写法以及知道区别在哪里,才算掌握的深搜。https://www.programmercarl.com/kamacoder/0099.岛屿的数量深搜.html/***@param{character[][]}grid*@return{number}*/varnumIslands=function(grid){letre......
  • 信创学习笔记(二),信创之CPU芯片架构思维导图
    创作不易只因热爱!!热衷分享,一起成长!“你的鼓励就是我努力付出的动力”各架构,操作系统,指令,代表生产商,服务器使用产品主要供应商......
  • 文案板块:5分钟掌握批量创作100条小红书爆款笔记文案(机器人实操训练)
    引言在数字营销的世界里,内容为王。但如何在短时间内制作出大量高质量的内容,以吸引并保持受众的注意力呢?作为普通人,你要有结果,你除非有非常过人的内容制作能力,不然就是批量化,否则大概率很难有办法突破短时间内的流量爆发。这种搞流量的方法确实也适合小白,因为基本上都是重复......
  • 初创企业:如何执行OKR周期?
    对于早期创业公司,Tita的OKR教练关于执行OKR周期推荐不是“季度+年度”,而是一下三个执行周期:一个月:”这个月我们在做什么“是关键问题团队负责人在月末前的周一上午聚在一起,记录下一个月的功能发布。这是一个自下而上的过程,其中包括完全在月内发布的项目和周期大于30天的项目的......
  • 100G GigE(Gigabit Ethernet,千兆以太网)与CXP
    100GGigE(GigabitEthernet,千兆以太网)与CXP(CoaXPress)接口在机器视觉和高速数据传输领域各有其独特之处。以下是对这两种接口的比较:一、带宽与速度100GGigE:带宽:100GGigE的最大带宽可达100Gbps或12,500Mbytes/s,是目前业界最快的单链路解决方案之一。优势:提供极高的数据......
  • 磁盘100%优化
    输入regedit,点确定。 在注册表中找到HKEY_LOACAL_MACHINE,并展开它。 接着找到SOFTWARE-Microslft-Dfrg,BootOptinizeFunction,并找到OptimizeComplete,双击它。   在弹出的对话框中将OptimizeComplete的值改为"no" 然后关闭注册表即可,重启后再查看磁盘占用......
  • 用Python1000多行代码实现ATM操作系统
    基于Python实现ATM操作系统概要基于Python语言,实现ATM的基本功能,包括查询余额、存款、取款、转账、注册等基本功能。能够实现用户和管理员两种身份识别,管理员有权限对系统做出修改,包括提升用户级别、关闭系统等操作。用户信息保存于user_data.txt文件中,也可自行接入数据库......
  • 打卡信奥刷题(276)用Scratch图形化工具信奥P1007[普及组/提高] 独木桥
    独木桥题目背景战争已经进入到紧要时间。你是运输小队长,正在率领运输部队向前线运送物资。运输任务像做题一样的无聊。你希望找些刺激,于是命令你的士兵们到前方的一座独木桥上欣赏风景,而你留在桥下欣赏士兵们。士兵们十分愤怒,因为这座独木桥十分狭窄,只能容纳......