2
栏目分类
热点资讯
噜噜 你的位置:av 动漫 > 噜噜 > SWAG IBM新芯片,吊打GPU
SWAG IBM新芯片,吊打GPU 发布日期:2024-10-29 01:51    点击次数:84

SWAG IBM新芯片,吊打GPU

若是您但愿不错每每碰面SWAG,接待标星保藏哦~

着手:内容编译自IBM,谢谢。

跟着东说念主工智能对其所运行的绸缪机的能量需求越来越大,IBM 想到部的科学家们从寰宇上最高效的绸缪机——东说念主类大脑中汲取灵感。

神经形态绸缪是一种旨在师法大脑的硬件设想和算法纪律。这一主张并不是形色一个精准的复成品,一个充满合成神经元和东说念主工灰质的机器东说念主大脑。相背,从事这一领域的大家正在设想一个绸缪系统的所有这个词层来响应大脑的着力。与传统绸缪机比拟,东说念主脑险些不使用任何电力,即使面临迷糊或界说不解确的数据和输入,也能灵验地处理任务。IBM 想到科学家正在期骗这一进化遗迹看成下一代硬件和软件的灵感,这些硬件和软件不错处理现在绸缪任务(尤其是东说念主工智能)所需的海量数据。

在某些情况下,这些力图仍处于长远研发阶段,目下它们大多存在于实验室中。但在其中一个案例中,原型性能数据标明,受大脑启发的绸缪机处理器很快就会上市。

什么是神经形态绸缪?

从词源上讲,“神经形态”一词的字面有趣是“大脑或神经元方法的特征”。但这个术语是否合乎该领域或特定处理器可能取决于你问的对象。它可能意味着试图重现东说念主脑中突触和神经元步履的电路,也可能意味着从大脑处理和存储信息的相貌中获取主张灵感的绸缪。

将夜视频在线观看免费

若是听起来神经形态绸缪(或大脑启发式绸缪)领域有些悬而未决,那只是因为想到东说念主员在构建模拟大脑的绸缪机系统时收受了截然相背的纪律。IBM 想到部门过火他机构的科学家多年来一直在力图开发这些机器,但该领域尚未找到典型的神经形态架构。

一种常见的脑启发绸缪纪律是创建荒谬浮浅、抽象的生物神经元和突触模子。这些模子实质上是使用标量乘法的静态非线性函数。在这种情况下,信息以浮点数的时事传播。当信息被放大时,终结便是深度学习。浮浅地说,深度学习是脑启发的——所有这个词这些数学神经元加起来便是师法某些大脑功能的东西。

IBM 想到科学家 Abu Sebastian 暗示:“在畴昔十年傍边的时辰里,这项技能取得了巨大成功,绝大多数从事与脑启发绸缪有关使命的东说念主推行上齐在从事与此有关的使命。”他暗示,通过集合神经元或突触能源学,或者通过与行为尖峰(而不是浮点数)进行交流,不错用其他脑启发相貌来用数学模拟神经元。

另一方面,模拟纪律使用先进的材料,不错存储 0 到 1 之间的一语气电导值,并履行多级处理——使用欧姆定律进行乘法,并使用基尔霍夫电流总数积聚部分和。

片上存储器如何抛弃经典瓶颈

类脑绸缪架构纪律的一个共同本性是片上内存,也称为内存绸缪。与传统微处理器比拟,这是芯片结构的根人道转机。

大脑分为多个区域和电路,缅想形成和学习(推行上是数据处理和存储)齐位于销亡位置。传统绸缪机并非如斯设立。使用传统处理器时,内存与进行绸缪的处理器是分开的,信息通过电路在两者之间往来传输。但在包含片上内存的神经形态架构中,缅想与抽象处理紧密有关,就像在大脑中相似。

这种架构是 IBM 内存绸缪芯片设想的主要特征,不管是模拟如故数字。

将绸缪和内存放在一说念的事理是,机器学习任务是绸缪密集型的,但任务本人并不一定很复杂。换句话说,有无数称为矩阵乘法的浮浅绸缪。终结身分不是处理器太慢,而是在内存和绸缪之间往来移动数据需要太万古辰并消费太多能量,尤其是在处理劳作的使命负载和基于 AI 的应用要领时。这种残障被称为冯·诺依曼瓶颈,以自微芯须臾代启动以来险些每种芯片设想齐收受的冯·诺依曼架构定名。借助内存绸缪,不错通过从 AI 锻练和推理等数据密集型过程中抛弃这种混欺诈从简无数能源和延伸。

在 AI 推理的情况下,突触权重存储在内存中。这些权重决定了节点之间的连系强度,在神经汇注的情况下,它们是应用于通过它们运行的矩阵乘法运算的值。若是突触权重存储在与处理位置分开的所在,况且必须往来传送,那么每个操作所消费的能量将弥远在某个点理会下来,这意味着更多的能量最终不会带来更好的性能。塞巴斯蒂安和他的共事开发了 IBM 的一种受大脑启发的芯片Hermes,他们确信他们必须突破移动突触权重所形成的断绝。谋略是制造性能更高、占用空间更小的 AI 加快器。

“内存绸缪将内存和绸缪之间的物理别离最小化或减少到零SWAG,”神经形态开发和系统小组的 IBM 想到科学家 Valeria Bragaglia 说。

以IBM 的 NorthPole 芯片为例,绸缪结构是围绕内存构建的。但 NorthPole 并莫得像模拟绸缪那样将内存和绸缪放在全齐调换的空间中,而是将它们交汇在一说念,因此不错更具体地称为“近内存”。但效果实质上是相似的。

受大脑启发的芯片

如何模拟神经元和突触

加州理工学院电气工程想到员卡弗·米德 (Carver Mead) 早在 20 世纪 90 年代就对神经形态绸缪领域产生了巨大影响,那时他和他的共事意志到有可能创建一种在景象学层面上雷同于神经元放电的模拟开发。

几十年后,Hermes 和 IBM 的另一款原型模拟 AI 芯片基本上便是这样作念的:模拟单位既履行绸缪,又存储突触权重,就像大脑中的神经元相似。这两种模拟芯片齐包含数百万个纳米级相变存储器 (PCM) 开发,这是一种模拟绸缪版块的脑细胞。

PCM 开发通过电流流过它们来分派权重,从而调动一块硫属化物玻璃的物理景况。当更多的电压通过它时,这种玻璃会从晶体从头陈列成非晶态固体。这使其导电性镌汰,从而调动矩阵乘法运算通过它时的值。在软件中锻练 AI 模子后,所有这个词突触权重齐存储在这些 PCM 开发中,就像缅想存储在生物突触中相似。

“突触不仅存储信息,还有助于绸缪,”IBM 想到科学家 Ghazi Sarwat Syed 说说念,他致力于设想 PCM 中使用的材料和开发架构。“关于某些绸缪,举例深度神经汇注推理,在 PCM 中共置绸缪和内存不仅不错克服冯·诺依曼瓶颈,而且这些开发还不错存储中间值,而不单是是典型晶体管的 1 和 0。” 谋略是创建绸缪精度更高的开发,不错密集地封装在芯片上,况且不错用超低电流和功率进行编程。

“此外,咱们正在尝试让这些开发更具特色,”他说。“生物突触不错万古辰以非易失性的相貌存储信息,但它们也会发生有顷的变化。”因此,他的团队正在想到如何调动模拟内存,以更好地模拟生物突触。一朝你有了这个,你就不错设想出新的算法来处理数字绸缪机难以处理的问题。

Bragaglia 指出,这些模拟开发的弊端之一是它们目下仅限于推理。“目下还莫得可用于锻练的开发,因为移动分量的准确性还不够高,”她说。一朝东说念主工智能模子在数字架构上进行了锻练,分量就不错被固定到 PCM 单位中,但径直通过锻练来调动分量还不够精准。此外,Syed 暗示,PCM 开发的耐用性不及以让其电导率调动一万亿次以致更屡次,就像在锻练时期发生的那样。

IBM 想到部门的多个团队正在力图处理材料本性不睬想和绸缪保真度不及形成的问题。其中一种纪律波及新算法,该算法不错处理 PCM 中模子权重更新时期产生的造作。它们仍处于开发阶段,但早期终结标明,很快就不错在模拟开发上进行模子锻练。

Bragaglia 参与了处理这个问题的材料科学纪律:一种称为电阻式立时存取存储器或 RRAM 的不同类型的存储开发。RRAM 的使命旨趣与 PCM 雷同,将突触权重的值存储在物理开发中。原子丝位于绝缘体里面的两个电极之间。在 AI 锻练时期,输入电压会调动丝的氧化,从而以荒谬抽象的相貌调动其电阻——况且在推理过程中,该电阻被读取为权重。这些单位以交叉阵列的时事陈列在芯片上,形成了一个突触权重汇注。到目下为止,这种结构一经显泄漏在模拟芯片中履行绸缪的同期保握更新活泼性的远景。这是在 IBM 的几个想到团队经过多年的材料和算法共同优化后才罢了的。

除了存储缅想的相貌除外,一些神经形态绸缪机芯片中数据流动的相貌可能与传统芯片中的流动相貌存在根底区别。在典型的同步电路(大多数绸缪机处理器)中,数据流基于时钟,具有一语气飘荡电流来同步电路的动作。时钟不错有不同的结构和多层,包括时钟倍频器,使微处理器大略以不同于电路其余部分的速率运行。但从根底上讲,即使没少见据正在处理,事情也会发生。

Syed 暗示,生物学收受的是事件驱动的脉冲。“咱们的神经细胞很少进行交流,这便是咱们如斯高效的原因,”他补充说念。换句话说,大脑只在必须使命时才使命,因此通过收受这种异步数据处理流,东说念主工模拟不错从简无数能源。

不外,IBM 想到部门研发的所有这个词三款受大脑启发的芯片均收受圭臬时钟经由进行设想。

在其中一个案例中,IBM 想到东说念主员暗示,他们在边际和数据中心应用方面取得了要紧说明。IBM 想到员 Dharmendra Modha 暗示:“咱们但愿从大脑中学习,但咱们但愿以数学的相貌从大脑中学习,同期针对硅进行优化。”他的实验室开发了 NorthPole,它不是通过晶体管物理学模拟神经元和突触的景象,而所以数字相貌捕捉它们的近似数学。NorthPole 收受公理化设想,并会通了受大脑启发的低精度;散播式、模块化、中枢阵列,在中枢里面和之间具有大畛域绸缪并行性;近绸缪内存;以及片上汇注。NorthPole 还从 TrueNorth 的脉冲神经元和异步设想转机为同步设想。

TrueNorth是一款实验性处理器,亦然更为复杂的 NorthPole 的早期跳板。关于这款处理器,莫德哈和他的团队意志到事件驱动的脉冲使用硅基晶体管的着力很低。大脑中的神经元以简略 10 赫兹(每秒 10 次)的频率辐射,而现在的晶体管以千兆赫的频率运行 - IBM 的 Z 16 中的晶体管以 5 GHz 运行,MacBook 的六核 Intel Core i7 中的晶体管以 2.6 GHz 运行。若是东说念主脑中的突触以与札记本电脑调换的速率运作,“咱们的大脑就会爆炸”,赛义德说。在诸如 Hermes 之类的神经形态绸缪机芯片中 - 或受大脑启发的芯片(如 NorthPole)的谋略是将数据处理相貌的生物启发与 AI 应用要领所需的高带宽操作相集合。

由于他们选定烧毁雷同神经元的脉冲和其他师法大脑物理的特征,莫德哈暗示,他的团队更倾向于使用“大脑启发”绸缪一词,而不是“神经形态”。他展望 NorthPole 有很大的发展空间,因为他们不错以纯数学和以应用为中心的相貌调遣架构,以取得更多收益,同期还不错期骗硅片的推广和从用户反馈中吸取的劝诫。数据暴露,他们的计谋成功了:在莫德哈团队的最新后果中,NorthPole 对 30 亿参数模子的推理速率比下一个最节能的 GPU 快 46.9 倍,能效比下一个最低延伸的 GPU 高 72.7 倍。

边际想考:神经形态绸缪应用

Syed 暗示,想到东说念主员可能仍在界说什么是神经形态绸缪,或者构建大脑启发电路的最好纪律,但他们倾向于合计它荒谬合乎边际应用——手机、自动驾驶汽车和其他不错期骗事前锻练的模子进行快速、高效的 AI 推理的应用。Sebastian 暗示,在边际使用 PCM 芯片的一个平允是,它们不错荒谬工致、性能高且价钱便宜。

Modha 暗示,机器东说念主应用可能荒谬合乎大脑启发式绸缪,以及视频分析,举例店内安全录像头。Bragaglia 暗示,将神经形态绸缪应用于边际应用不错匡助处理数据秘籍问题,因为开发内推理芯片意味着数据不需要在开发之间或云表往来传输,即可进行 AI 推理。

不管最终哪种脑启发式处理器或神经形态处理器胜出,想到东说念主员也一致合计,目下的 AI 模子过于复杂,无法在传统 CPU 或 GPU 上运行。需要有新一代电路来运行这些苍劲的模子。

“这是一个荒谬慷慨东说念主心的谋略,”布拉格利亚说。“这荒谬禁绝,但相应时东说念主甘愿。而且它正在说明中。”

https://research.ibm.com/blog/what-is-neuromorphic-or-brain-inspired-computing

半导体杰作公众号保举

专注半导体领域更多原创内容

祥和民众半导体产业动向与趋势

*免责声明:本文由作家原创。著作内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或复古,若是有任何异议,接待干系半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第3929内容,接待祥和。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

心爱咱们的内容就点“在看”共享给小伙伴哦