Arm为无处不在的AI奠定技术基础
作为人工智能(AI)的创新基础,众多企业都在使用通用且应用广泛的Arm计算平台。迄今为止,合作伙伴基于Arm架构的芯片出货量已超过2900亿颗。如今,Arm已为各类技术领域的AI应用提供支持,这也是为何AI的技术先行者们能够基于Arm平台快速创新的关键原因。
无论是现在还是未来,Arm平台都是AI运行的基石。若要满足对AI技术和应用的旺盛需求,则必须在计算领域的方方面面实现无处不在的AI功能。从使用无数处理器训练大语言模型(LLM)的大型数据中心,到全球数字消费者每天接触边缘AI的电子设备,计算领域的方方面面都有AI的身影。
高效的AI计算
若要满足AI对高算力的需求,则少不了对高效计算性能的投入。生成式AI的发展推动了对AI算力和资源的需求空前增长。一名荷兰研究人员指出,如果一年内每次使用Google进行搜索都运用到AI,其所需的电力相当于爱尔兰全国一年的用电量。长远来看,考虑到地球上资源有限,这种方法是难以为继的。
Arm提供了计算性能和能效的卓越组合,推动了智能手机领域的技术革新,而同样的趋势也正发生在AI革新中。
数据中心中的AI
头部超大规模服务运营商正采用定制芯片战略,来进行数据中心转型,以迎接AI时代。
软银公司正在与NVIDIA合作,建设全球首座采用基于Arm架构的Grace Hopper超级芯片的5GAI 数据中心。这一突破性的AI加速CPU专为超大规模AI和高性能计算应用而设计。Grace Hopper 基于72颗Arm Neoverse V2 核心打造,在AI的高负荷任务中实现了10倍的性能飞跃,同时大幅提高了每瓦性能。微软则在此前发布了其首款专为云计算打造的定制芯片Azure Cobalt 100 处理器,该处理器基于Arm Neoverse CSS N2打造。此外,基于Arm Neoverse平台的AWS Graviton3可以使AI推理(使用训练后的模型对新的真实数据进行预测的过程)的成本节约50%。
在数据中心中约有85%的AI工作负载用于运行推理,其驱动了各种用例、行业和设备的AI应用,因此企业有巨大的动力来降低相关的能源消耗和成本。
边缘AI
除了数据中心和云服务,许多AI工作负载还需要在设备上进行处理,以便更有效地分布AI工作负载。
在设备上处理AI工作负载已经成为现实,无论是智能手机、智能家居设备还是智能汽车,这一趋势将继续增长,特别是随着大语言模型(LLM)变得更加高效,并针对特定任务、用例或设备而专门打造。直接在采集数据的设备上处理AI计算,可以带来更快、更安全的用户体验并减少延迟,这对于工业和汽车应用等对安全性要求很高的用例来说至关重要。
开发者正在编写更精简的AI模型,以在小型微处理器甚至更小的微控制器上运行,从而节省能源、时间和成本。例如,Plumerai提供的软件解决方案可在基于Arm Cortex-A和Cortex-M的系统级芯片(SoC)上加速神经网络,并在基于Arm架构的微控制器上运行略高于1MB的AI代码,其可执行面部检测和识别等功能。
基于处理器技术的AI
无论是由CPU处理全部AI工作负载,还是由GPU或NPU等协处理器提供支持,AI处理始于CPU。
过去十年间,Arm的CPU和GPU的AI处理能力每两年就实现翻番,目前70%的第三方应用中的AI都基于Arm CPU 运行,在关键技术市场中推动了边缘AI的显著发展。
基于Armv9 CPU和GPU技术打造的高性能AI手机现已问世,其中包括搭载MediaTek天玑9300的vivo X100和X100 Pro智能手机,以及Google Pixel 8,这是首款专为Google的AI模型Gemini Nano进行工程研发的智能手机,可在边缘执行一系列AI的任务。与此同时,超过200亿个基于Arm架构的SoC能够运行各种物联网设备上广泛的ML工作负载,包括基于Cortex-M处理器、Arm Ethos-U NPU 和Cortex-A CPU打造的设备。而在汽车领域,如今的车用芯片可实现基本的AI功能,如障碍物检测、3D视图和简单的传感器融合,这些功能都在Arm CPU上运行。下一代基于AI的汽车功能,如先进驾驶辅助系统(ADAS)和自动驾驶功能,也基于Arm CPU而构建。
全球最大的开发者社区
Arm持续的软件投入正建立起全球最大的AI开发者社区。
Arm致力于以最常见的方式让开发者能够更简单、更快速、更安全地进行编码,携手实现无处不在的AI。如今,超过一亿用户可以使用Arm NN软件开发工具包,在Arm CPU和GPU上优化ML工作负载。对于全球1500万Arm架构设备开发者来说,这使他们能够运行复杂的AI和ML工作负载,确保将应用更快地推向市场。
Arm在其业界领先的生态系统中开展了一系列合作,以使其对开发者的AI承诺付诸实践。此外,Arm还通过开源框架和库,为基于Arm架构的硬件提供强大的ML功能,为开发者提供全方位支持,包括TensorFlow、PyTorch、Caffe2、OpenVINO和TVM,从而为开源社区打造AI创新基础。
写在最后
AI为下一个技术创新奠定了基础,引领社会进入一个潜力非凡的新时代。而实现这一切的前提正是让AI无处不在。这不仅意味着要在云端、数据中心和超级计算机中实现AI,还要确保复杂的AI工作负载能够在更小、更受限的边缘技术和设备上运行。能效与性能对于推动边缘AI的发展同等重要。
Arm正在促成这一目标。Arm提供了应用广泛的通用计算平台,赋能边缘设备和其他领域的各种可能性。无论是CPU、GPU、ISP还是NPU,Arm在每一代产品中都增加了更多AI性能、效率功能及安全特性,同时还为合作伙伴提供了多样的灵活性,使它们能够集成和开发自己的创新解决方案。而在软件、工具和生态系统方面,IP与开源软件和工具乃至广泛的行业领先生态系统相结合,让全球上千万开发者都可以使用Arm计算平台作为AI创新的基础。从传感器、智能手机,到工业级物联网、汽车和数据中心,基于Arm平台的AI无处不在。
(8992449)
ARM:供给中国 160 亿颗芯片,继续授权华为
Arm中国执行董事长兼CEO吴雄昂
记者 | 胡巍巍
出品 | CSDN(ID:CSDNnews)
2019年5月15日,美国商务部将华为及其70家附属公司纳入实体清单。
当时,还有消息称,Arm将要断供华为。
对此,在9月26日的Arm中国媒体沟通会上,Arm中国执行董事长兼CEO吴雄昂、和华为海思CIO刁焱秋同时出面。
ARM方称,华为海思是Arm长期合作伙伴,不管是V8架构还是未来的后续架构,Arm都会在合乎相关国家法规的情况下,向包括华为在内的中国公司继续提供。
华为刁焱秋则表示,Arm既是华为的长期合作伙伴,也是华为长期的投资伙伴,华为一直以来都在投资参与Arm的生态建设。
在10月23日举办的Arm技术峰会北京站上,Arm中国执行董事长兼CEO吴雄昂再次表态称,Arm是唯一的非美国计算平台,并且经过法务调查,无论V8还是V9架构均源自英国的技术,Arm会和过去一样持续向中国企业进行授权和服务支持。
这也再次说明,虽然有外界不可抗的风波,但是华为和Arm依然肝胆相照。
对于Arm在中国的合作情况,吴雄昂如是总结道,目前Arm在中国有超过200个合作伙伴,中国客户基于Arm技术的芯片累计出货量超过160亿颗,95%的国产芯片都是基于Arm架构。
此外,在本次技术峰会上,Arm有三大重要发布!
它们分别是:Ethos-N57与Ethos-N37 NPUs、Mali-G57 GPU和Mali-D37 DPU。
按照英文原意,“Ethos[ˈiːθɑːs]”是“(某团体或社会的)道德思想,道德观”的意思,“Mali[ˈmɑli]”则是园丁的意思。
从名字上来说,寓意很美好。那么,“道德的园丁”就有哪些特性呢?
三款产品:Ethos-N57与 Ethos-N37 NPUs、
Mali-G57 GPU、Mali-D37 DPU
Ethos-N57 与 Ethos-N37 NPUs: 异构计算提供者
Ethos-N57与Ethos-N37的NPU组合,旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。
由于消费者的设备,越来越智能化,通过专属的ML处理器,提供额外的AI性能与效率,就显得非常有必要。
全新的Ethos,对成本与电池寿命最为敏感的设计进行了优化,从而可以让NPU为日常生活设备带来优质的AI体验。
Ethos-N57与Ethos-N37的设计理念,包括一些基本原则,例如:
针对Int8与Int16数据类型的支持性进行优化;
先进的数据管理技术,以减少数据的移动与相关的耗电;
通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200%。
此外,Ethos-N57的功能还包括:
旨在提供平衡的ML性能与功耗效率
针对每秒2兆次运算次数的性能范围进行优化
Ethos-N37的功能还包括:
为了提供面积最小的ML推论处理器(小于1平方毫米)而设计
针对每秒1兆次运算次数的性能范围进行优化
Mali-G57:给你带来 智能与沉浸式体验的GPU
Mali-G57 GPU,将智能与沉浸式体验,带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。
可以说,这是移动市场划分中最大的一部分,而Arm最近与Unity的发布,也强调了其基于Arm IP的片上系统(SoC)、CPU、GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。
据了解,Mali-G57关键功能包括:
与Mali-G52相比,各种内容都能达到1.3倍的性能密度
能效比提升30%,使电池寿命更长
针对虚拟现实(VR)提供注视点渲染支持,且设备ML性能提升60%,以便进行更复杂的XR实境应用
Mali-D37: Arm单位面积效率最高的DPU
Mali-D37,是一个在最小的可能面积上,包含着丰富显示与性能的DPU。
对于终端用户而言,这意味着当面积成为首要考虑,在入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
Mali-D37关键功能包括:
单位面积效率极高,DPU在支持全高清(Full HD)与2K分辨率的组态下,16纳米制程的面积将小于1 mm2。
通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。
从高阶的Mali-D71保留关键的显示功能,包括与Assertive Display 5结合使用后,可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。
据了解,本次技术峰会除了“北京站”,还有“上海站”。
Arm过去未来三两事
诞生于英国剑桥的ARM公司,最初是苹果、诺基亚、Acorn、VLSI、Technology等公司的合资企业。
成立28年间,ARM通过出售芯片技术授权,建立起了新型微处理器设计、生产和销售的商业模式。
也就是说,它既不生产芯片,也不售卖芯片,而是通过出售芯片设计技术授权来盈利。
当下的ARM,已将把技术,授权给世界上许多著名的半导体、软件和OEM厂商。IBM、三星和华为等都是其客户。
2016年7月,日本软银以约合310亿美元的价格收购ARM。
有媒体评论称:“凭借这笔收购,ARM将让软银成为下一个潜力巨大的科技市场(即物联网)的领导者。”
那么未来,Arm一定会在5G和物联网愈加普及的中国,部署更多的动作。
这样,也就不难理解为何Arm会和华为,联合回应传闻。
那些国人曾经羡慕和学习的外企,如今越来越重视我们脚下这篇土地。
作为技术人,你该如何回应这种重视,以便让自己发展得更好呢?这个问题,与你共思。
【END】
相关问答
华北电力大学 自动化 就业方向 - 茶米 的回答 - 懂得自动化涵盖面很广,电力主要是去电力公司,也就做做电力检测、控制,好点的就自己设计电力变幻和控制电路(自动化专业中的电力电子这门专业课会讲)。这...
帮个忙老铁们!急!急!急!海南有名气的 电力 电源模块哪家安全,...[回答]旺文科技是国内唯一一家应用ARM技术从事直流电源和交流电源领域的相关监控系统研发、生产和销售的高科技企业。主要提供:智能交流配电柜、智能精密...
请推荐 柳州 电力 电源模块厂商销售, 电力 电源模块服务态度好...[回答]旺文科技是国内唯一一家应用ARM技术从事直流电源和交流电源领域的相关监控系统研发、生产和销售的高科技企业。主要提供:智能交流配电柜、智能精密...
电气专业的大学生在课余时间能为未来做些什么?很多本科专业其实很尴尬,它们往往不如专科更加目标明确、实践不如专科更具体、丰富,而理论也不如研究生阶段更深刻。所以往往给人们的感觉就是“这个也能干、...
前15年发展最快的产业可能是房地产和汽车,后15年发展最快的...幸福里为您提供"前15年发展最快的产业可能是房地产和汽车,后15年发展最快的应该会是哪个产业呢?"的专业解答,收集各类观点,以更多视角为您解答疑惑,咨询更多房...
前15年发展最快的产业可能是房地产和汽车,后15年发展最快的...幸福里为您提供"前15年发展最快的产业可能是房地产和汽车,后15年发展最快的应该会是哪个产业呢?"的专业解答,收集各类观点,以更多视角为您解答疑惑,咨询更多房...
如何在ucos下进行 arm 编程?8、学习Linux操作系统。(1)、《UNIX环境高级编程》(2)、细读“joyfire笔记”,可在“qianrushi.com”网站的好书下载栏目获取(3)、细读《linux内核......
前15年发展最快的产业可能是房地产和汽车,后15年发展最快的...幸福里为您提供"前15年发展最快的产业可能是房地产和汽车,后15年发展最快的应该会是哪个产业呢?"的专业解答,收集各类观点,以更多视角为您解答疑惑,咨询更多房...
前15年发展最快的产业可能是房地产和汽车,后15年发展最快的...幸福里为您提供"前15年发展最快的产业可能是房地产和汽车,后15年发展最快的应该会是哪个产业呢?"的专业解答,收集各类观点,以更多视角为您解答疑惑,咨询更多房...
在线的大神 帮个忙呗!!服务周到的 电力 电源模块售价, 电力 电...[回答]旺文科技是国内唯一一家应用ARM技术从事直流电源和交流电源领域的相关监控系统研发、生产和销售的高科技企业。主要提供:智能交流配电柜、智能精密...