首页 > 教育综合知识 > 教育综合知识 > 芯趋势丨存算一体,AI计算的最优解?

芯趋势丨存算一体,AI计算的最优解?

发布时间:2024-08-09 16:15:02来源: 15210273549

随着人工智能与大数据技术的飞速发展,我们正步入一个以大模型为核心的新时代。然而在这一浪潮中,传统的冯·诺依曼架构却逐渐显露出其狭隘性。

该架构虽然奠定了现代计算机的基础,但在面对海量数据处理与大模型训练时,却受限于存储与计算分离的设计,导致数据搬运成为性能瓶颈,严重制约了计算效率的提升。

为了突破这一瓶颈,业界开始将目光聚焦于另一个计算架构——存算一体,这是一种将存储和计算功能融合在同一个芯片上的技术架构。

事实上,存算一体的概念由来已久。早在1969年,斯坦福研究所的Kautz等人提出了存算一体计算机的概念。但受限于当时的芯片制造技术和算力需求的匮乏,那时存算一体仅仅停留在理论研究阶段,并未得到实际应用。

而近年来,随着半导体制造技术突破,以及AI等算力密集应用场景的崛起,存算一体技术也得到迅猛发展。2017年,英伟达、微软、三星等提出存算一体原型,随后,国内也诞生一批存算一体芯片企业,苹芯科技是其中之一。

8月8日,苹芯科技正式发布了两款新品,包括存算一体NPU“PIMCHIP-N300”和多模态智能感知芯片“PIMCHIP-S300”,后者采用的是28纳米制程工艺。

苹芯科技CEO杨越在接受21世纪经济报道记者采访时指出,“存算一体就是要在成熟制程实现高级制程的计算能力,这让我们不用非去卷高级制程”。

打破冯·诺依曼架构

在存算一体技术出现之前,计算架构基本都是遵循冯·诺依曼架构,即存储与计算单元分离。

杨越向记者表示,在冯·诺依曼架构下,当计算发生时,数据需要在存储和计算单元直接传输。而在AI算力芯片中,超过90%的功耗都消耗在传输上,所以原来的架构在计算效率上很难支撑AI的发展。

此前,提高计算效率的办法就是升级制程工艺,从最初的65纳米、40纳米已经变成7纳米、5纳米甚至3纳米。然后,这种方法后来也遭遇了瓶颈。

因此2020年前后,国内出现一批公司,他们试图从其他维度去解决计算效率提升的问题。“比如存算一体公司、量子计算公司、光子芯片公司等,这些公司希望去改变芯片的架构来减少数据的搬移。而在不同的技术路径中,存算一体是落地性最强的一个赛道”。杨越说。

在存算一体赛道中,不同公司也存在差异,主要是底层所采用的Memory(存储器)类型不同。有的是用flash做,有的是用静态随机存储器(SRAM)做,还有的是用新型存储器——忆阻器来做。

杨越告诉记者,不同的Memory所具有的特性不同,有的密度高,有的耐久性更好。而苹芯科技选择SRAM,是因为它的产品化能力最强。

“在用户最关心的几个性能维度上,比如读写的延时、耐久性、Memory可擦写的次数、高级制程兼容性等,SRAM的表现都是最优的。另外,因为SRAM在计算机体系中已经存在几十年了,它的成本、良率都很稳定。所以如果想要快速产品化,SRAM会是最优的解决方案”。杨越表示。

另外,即便是使用同一种Memory来做的企业,面向的场景也可能不同。有些公司选择了大算力场景,比如汽车、服务器,苹芯科技选择的则是小端侧场景,比如智能可穿戴设备、智慧家居等。

杨越称,选择小端侧场景,是因为算力整体并不是特别大,但是对于功耗的要求又比较敏感。“做出这一选择,我们是从电路、系统架构、应用、成本等角度进行了综合考量,觉得小端侧场景更适合快速出产品”。

他举例说,“我们团队的背景之前都是做新型存储器的,但我们仍然采用SRAM方案,核心原因就是我们认为这个方案在2-3年内可以产品化,这是符合投资人商业逻辑的,也是符合产业商业逻辑的”。

大厂留下的机会

目前,包括英特尔、三星、IBM、AMD等在内的传统芯片厂商都在布局存算一体,苹芯科技等初创公司如何应对与巨头的竞争?

杨越表示,从行业角度,大家做的事情是趋同的,就是希望让数据的搬运彻底消失。包括苹芯科技在内的一些初创公司,其优势在于选择了存内计算方案,这几乎能将缩短数据距离这件事做到极致化。但大厂们不太可能去这样做,因为他们要考虑通用性的问题,这实际上也为创业公司提供了机会。

据记者了解,存算一体技术可分为三类:近存计算(Processing Near Memory, PNM)、存内处理(Processing In Memory, PIM)和存内计算(Computing In Memory, CIM)。

其中,近存计算是利用先进的封装技术,将计算芯片和存储器封装到一起,通过减少内存和处理单元之间的路径,提高传输效率;存内处理侧重于将计算过程尽可能地嵌入到存储器内部,减少处理器访问存储器的频率;存内计算则是将计算和存储完全融合的技术,通过电路革新或集成额外的计算单元来实现。

因为存内计算对制程工艺要求不高,所以这也是国内创业公司主要选择的技术路径。华西证券在一份研报中指出,近存计算的代际设计成本较低,适合传统架构芯片转入,目前该技术已经十分成熟,被广泛应用于各类CPU和GPU上。而存内计算主要用于算法固定的场景算法计算。

杨越指出,目前电子产品正朝着小型化、智能本地化的方向发展,这给存算一体创业公司带来了很大的市场机遇。

“小型化意味着电池不能做得太大,然后还要去很好地驱动AI计算,这在传统架构中很难实现。比如现在基于传统架构的一些智能设备,当它们打开AI功能时,非常容易发热,原因在于有大量的数据搬运,而存算一体可以将产品体验变得更好”。他说。

据杨越介绍,苹芯科技的产品未来会有两个迭代方向,一是在功能上,要从现在的卷积神经网络(CNN)迭代到Transformer模型,二是在计算效率上,会把制程工艺从现在的28纳米,升级到22纳米、14纳米,最终定格在12纳米。

教育综合知识更多>>

快手程一笑内部演讲:坚定AI投入 直面竞争与挑战 荣耀新一代小折叠曝光:外观设计微调 外屏比例不变 荣耀 400 / Pro 手机首销:2 亿超清写真人像主摄,2499 元起 索尼PS5系统更新:优化界面提示,提升用户体验 耐尔金红米K70手机壳超薄磁吸全包防摔磨砂保护套 小米北京五棵松举办人车家生态展,家电全品类亮相 海尔周云杰:欢迎小米入局家电,竞争共促发展 小米辣920:直播界的“百变歌姬”,用音乐诠释多元魅力 618哪款华为手机卖得最好?畅销榜TOP10排行出炉 鸿蒙万元机皇!华为曝全新三折叠屏:处理器升级 「预计6月份,问界M8交付2-3万台」 华为明牌了啊! 小鹏华为联手发布抬头显示智能方案 2025年全球智能手机出货量预期下调,华为增长领先 OPPO 向大众汽车集团网联汽车许可蜂窝通信标准必要专利 小米玄戒O1破冰之后,又一3nm芯片入场:3.9GHz+三星基带! 注意!三星堆博物馆6月12日至6月13日临时闭馆 惠普基于 Hailo-10H 打造 M.2 外形 AI 加速器,面向零售酒店行业 联想智能体工作站完成Qwen3全系适配,携手ISV加速行业应用落地 小红书估值升至260亿美元,或年内启动IPO 广西发布2024年广西农村电商发展数据及2025年数商兴农计划 云南出台12条措施支持青年返乡创业电商 广州与京东“共生”,十年携手共筑高质量发展之路 京东一季度营收领跑互联网行业 京东加码“酒店+机票”业务,高薪引才备战暑期档 天猫618格力电器董事长董明珠将首次入淘开播 淘宝天猫祭出官方物流品牌“极速上门”,联合顺丰开启首期服务公测 代号迈巴赫!荣耀Magic V5本月发布:骁龙8至尊领先版轻薄大折叠 AI浪潮下的破局者:荣耀以人才战略重构全球竞争力 618选高质价比手机 首推性能强的一加Ace 5至尊版! 推动二手手机循环利用已成为循环经济发展的当务之急