首页 > 其他分享 >IBM 研究出一种突破冯·诺依曼瓶颈的芯片

IBM 研究出一种突破冯·诺依曼瓶颈的芯片

时间:2023-11-13 10:14:31浏览次数:35  
标签:IBM NorthPole 芯片 诺依曼 内存 计算

导读 IBM 的 NorthPole 处理器无需访问外部存储器,从而提高了计算能力并节省了能源。NorthPole 芯片将内存和处理功能结合在一起,从而极大地改进了图像识别和其他计算任务。

IBM 研究出一种突破冯·诺依曼瓶颈的芯片IBM 研究出一种突破冯·诺依曼瓶颈的芯片
(图片来源:IBM Corp.)

加州圣何塞 IBM 的研究人员开发了一种受大脑启发的计算机芯片,可以通过以更少的功耗更快地工作来增强人工智能 (AI)。他们的 NorthPole 处理器芯片消除了频繁访问外部存储器的需要,因此执行图像识别等任务的速度比现有架构更快,同时消耗的电量大大减少。

“它的能源效率令人惊叹”,巴黎萨克雷大学帕莱索分校的纳米电子学研究员达米安·奎利奥兹 (Damien Querlioz) 说道。他说,这项发表在Science 1上的研究表明,计算和内存可以大规模集成。“我觉得这篇论文将动摇计算机架构中的普遍思维。”

NorthPole 运行神经网络:简单计算单元的多层阵列,经过编程可识别数据模式。底层接收数据,例如图像中的像素;每个连续层都会检测复杂性不断增加的模式,并将信息传递到下一层。顶层产生一个输出,例如,可以表示图像包含猫、汽车或其他物体的可能性。

因瓶颈而减慢

一些计算机芯片可以有效地处理这些计算,但每次计算一层时它们仍然需要使用称为 RAM 的外部存储器。以这种方式在芯片之间传输数据会减慢速度——这种现象被称为冯·诺依曼瓶颈,以数学家约翰·冯·诺依曼命名,他首先构想了基于处理单元和单独内存单元的计算机标准架构。

冯·诺依曼瓶颈是减缓计算机应用程序(包括人工智能)速度的最重要因素之一。它还导致能源效率低下。研究合著者、IBM 计算机工程师 Dharmendra Modha 表示,他曾经估计在这种架构上模拟人脑可能需要相当于 12 个核反应堆的输出。

NorthPole 由 256 个计算单元或核心组成,每个计算单元都包含自己的内存。“你正在缓解核心内的冯·诺依曼瓶颈,”Modha 说道,他是 IBM 位于圣何塞的 Almaden 研究中心的类脑计算首席科学家。

莫达说,这些核心在一个网络中连接在一起,其灵感来自于人类大脑皮层各部分之间的白质连接。这一设计原则和其他设计原则(其中大部分以前就存在,但从未被整合到一个芯片中)使 NorthPole 在图像识别的标准基准测试中以大幅优势击败现有的人工智能机器。尽管没有使用最新、最小型化的制造工艺,但它使用的能量仅为最先进人工智能芯片的五分之一。作者估计,如果 NorthPole 设计采用最新的制造工艺,其效率将比当前设计提高 25 倍。

在正确的道路上

但即使是 NorthPole 的 224 MB RAM 也不足以支持大型语言模型,例如聊天机器人 ChatGPT 使用的语言模型,即使在最精简的版本中也会占用数千兆字节的数据。而且该芯片只能运行预编程的神经网络,这些神经网络需要在单独的机器上提前“训练”。但该论文的作者表示,NorthPole 架构在自动驾驶汽车等速度关键型应用中可能很有用。

NorthPole 使内存单元在物理上尽可能靠近核心中的计算元件。在其他地方,研究人员一直在利用新材料和制造工艺开发更激进的创新。这些使存储单元本身能够执行计算,原则上可以进一步提高速度和效率。

上个月描述的另一种芯片使用忆阻器进行内存计算,忆阻器是能够在电阻器和导体之间切换的电路元件。“IBM 和我们的这两种方法都有望减少延迟并降低与数据传输相关的能源成本,”忆阻器研究的共同作者、北京清华大学的高斌说道。

另一种方法是由多个团队(包括位于瑞士苏黎世的独立 IBM 实验室)开发的,通过改变电路元件的晶体结构来存储信息。这些新方法能否在经济上得到推广还有待观察。

原文来自:https://www.nature.com/articles/d41586-023-03267-0

本文地址:https://www.linuxprobe.com/?p=286460

标签:IBM,NorthPole,芯片,诺依曼,内存,计算
From: https://www.cnblogs.com/linuxprobe19/p/17823183.html

相关文章

  • imx.6ull芯片uboot编译下载
    开发环境配置及编译参考:linux开发基于iMX6ULL-uboot编译环境配置 下载官方的SDK包 下载完成之后开始直接安装将SDK包解压到对应的文件目录 本地安装目录是imx6ullSK打开文件夹里边有官方给的各种配置文件模板,MFGTools下载链接 下载最新的日期的工具,等待下载完成 ......
  • PCF8574芯片介绍及驱动方法
    (文章目录)前言本篇文章带大家学习PCF8574芯片,了解PCF8574芯片有什么作用,以及学习PCF8574的控制方法。一、PCF8574芯片介绍PCF8574是TI(TexasInstruments)公司生产的一种常见的I/O扩展芯片,用于将微控制器的少量GPIO引脚扩展为更多的GPIO接口。它采用I2C总线(串行通信协议)进行与......
  • 基于MacOS M2 芯片的Mysql 数据库安装与使用
    第一步:MySQL软件下载与安装1.1 登录网址:https://dev.mysql.com/downloads/mysql/,选择系统:MacOS,版本:8.0.35,或者更新的版本,OSversion选择ARM,64-bit,点击下Download1.2 接下来安装软件:双击mysql-8.0.35-macos13-arm64.dmg,点继续或下一步,使用强密码usestrongpasswordencr......
  • Linux MIPI 摄像头驱动框架编写(RN6752解码芯片)
    一、概述在编写MIPI摄像头驱动之前,需要先了解Media子系统的链路关系,这里我就不介绍了,需要的看我之前的笔记:LinuxMedia子系统链路分析。理解Media子系统链路关系后,会发现ISP不论是在摄像头端,还是集成在SOC中,驱动程序都是差不多的。多观察一下开发板中的其他案例,便会......
  • SUB-1G芯片---PAN3031低功耗远距离无线收发芯片
    PAN3031是一款采用ChirpIoTTM调制解调技术的低功耗远距离无线收发芯片,支持半双工无线通信,工作频段为370~590MHz和740~1180MHz,该芯片具有高抗干扰性、高灵敏度、低功耗和超远传输距离等特性。最高具有-129dBm的灵敏度,22dBm的最大输出功率,产生业界领先的链路预算,使其成为......
  • MIPI/DSI转eDP新选择CS5523芯片替代LT8911EXB,IT6151
    ASL(集睿致远)CS5523是一颗MIPIDSI输入,DP/eDP输出转换芯片。MIPI输入4lanes,每lane最大支持1.5Gbps,DP/eDP输出最多支持4lanes,每条lane最大支持2.7Gbps。芯片内部有一个MCU,自带flash。功能框图:特点:MIPIDSI输入和DP/eDP输出支持抖音和6位+FRC。将PWM......
  • 全志T507-H技术帖 | 去掉IO扩展芯片后保留扩展引脚功能的实现方法
    飞凌嵌入式推出的OKT507-C作为一款广受欢迎的开发板拥有丰富的功能接口,而实际上OKT507-C开发板的CPU引脚资源是比较紧缺的,那么它究竟是如何提供如此丰富的接口资源的呢?答案就是IO扩展芯片——TCA6424A。这是一个24位I2C和系统管理总线(SMBus),输入输出(I/O)扩展器有中断输出......
  • CC1101 一款低功耗sub- 1ghz收发器芯片 适用于无线遥控智能家居
    产品描述CC1101是一个低成本的sub-1ghz收发器,专为极低功耗的无线应用而设计。该电路主要用于工业、科学和医学)和SRD(ShortRangeDevice)频带,在315,433,868和915兆赫,但可以轻松可编程用于其他操作频率在300-348MHz、387-464MHz,以及779-928MHz频段。射频收发器集成了一......
  • LCD液晶超抗干扰段码显示屏驱动芯片VK1C21A/B/C/D/DA/E/EA具备显示效果好,静电耐压高等
    产品型号:VK1C21A/B产品品牌:永嘉微电/VINKA封装形式:SSOP48/LQFP48可定制裸片:DICE(COB邦定片);COG(邦定玻璃用)产品年份:新年份联系人:邱婷联系QQ:2689802003联系手机:18823668825原厂,工程服务,技术支持! 概述:VK1C21A/B是一个点阵式存储映射的LCD驱动器,可支持最大128......
  • FS2957 降压恒压芯片内置120V功率管36V48V60V72V80v降压5V
    随着科技的不断进步,电子设备在我们的生活中越来越普及,而电源管理芯片作为电子设备中的重要组成部分,也得到了广泛的应用。今天,我们要介绍的是一款具有高性价比的FS2957降压恒压芯片,它内置120V功率管,适用于36V、48V、60V、72V、80V的降压5V输出。FS2957降压恒压芯片采用专利的电流模......