对阵ChatGPT们,存算一体超异构突破算力天花板在即

文摘:国产自主意识爆发,3.14、亿币率先提出存算一体超异形,引领新一代技术潮流。AI3.0时代,国产自主意识爆发ChatGPT诞生以来,国内AI界掀起千层浪潮的首先是百度、科技新闻飞等AI大企业相继表明自己具有类ChatGPT能力;其次国家发布东西算一体化算力服务平台,支持中国人工智能运算平台所需的海量服务。而实现更大的计算能力,都需要依靠“大脑”AI芯片。纵观国内AI芯片的发展史,我们可以将AI芯片的国产化分为几个时期。在AI芯片国产化1.0时代,谷歌推出ASIC芯片后,国内的Cambria、灵汐、华为等厂商纷纷跟进,推出面向云AI应用的ASIC架构芯片。此后,AI芯片的国产化进入了2.0时代。在看到以NVIDIA为代表的GPGPU架构在AI计算功率芯片上具有出色性能后,国内众多厂商纷纷布局GPGPU芯片,强调CUDA兼容性,考验AI计算功率芯片的极限,如日日智芯、珠海芯动力、壁燕等。在前两个时代,国内AI芯片厂商纷纷顺应时代潮流,跟随国际厂商的脚步,通过研发最新芯片来解决AI计算能力芯片的挑战。目前,随着ChatGPT等大机型的蓬勃发展,我们站在人工智能芯片国产化3.0时代的门槛上,面对日益严峻的地缘政治形势,希望国产芯片厂商有更强的自主意识,能够自发地提出芯片解决方案。例如,国内AI大数芯片亿元科技,多次提出中国AI大数芯片的方案是2020年,亿元科技成立和架构创新突破诺伊曼瓶颈,首次研发基于ReRAM RRAM的全数字一体化AI大数芯片。为国内AI力量特别是大数力量提供了新的方向。今年3.14日,在“电子创新网”的“从ChatGPT的角度讨论蓄热一体AI大数芯片”直播中,亿铸科技的创始人熊大博士首次提出了“蓄热一体超异型制作AI大数芯片”的技术思想。亿铸科技之所以多次提出新的解法,是因为AI算力的难题越来越严重,国产化AI芯片的情况越来越困难。首先,计算能力本身由于摩尔定律的失败而加速,每5-10个月就会翻一番。

不同机器学习时代的计算能力增长趋势图来源Zheshang Securities预测,到2030年,计算能力将增加到56ZFlops,复合年增长率将达到65%。而且,这是ChatGPT还没有到来时,通常的计算能力需求预测值。

全球算力规模及增速图源,这就是参数规模1750亿的GPT-3,除此之外还有参数5620亿的PaLM-E......当时,算力及其背后的功耗还充裕吗AI算力需求就像一匹失控的马,但FPGA、ASIC、GPGPU等芯片本身,已经在为先进的工艺苦苦挣扎。核心粒子理论认为,目前芯片先进工艺的升级面临着性能限制、技术限制和成本限制。成本的界限是,具体来说,在5nm以下时,建设具备高度工艺的芯片工厂需要数十亿美元的投资。虽然成本高昂,但过程是结束,但能效比的提高是有限的在传统架构中,数据需要频繁地在存储、计算单元之间来回移动,因此随着数据的增多,“存储墙”、 “能耗墙”、“编译墙”等问题也变得更加严重。目前,这“三堵墙”导致了大量计算能力的浪费,据统计,在大计算能力的AI应用中,数据搬运操作消耗的时间和功耗高达90%,数据搬运的功耗是运算的650倍。ChatGPT等人提出了对计算能力的“极其荒谬、不现实”的需求,芯片们陷入了先进工艺升级已达到极限、能效比提高受阻等困境,时代要求人工智能大计算能力芯片注入新鲜血液。突破天花板的内力亿铸科技自发提出的蓄热一体架构、蓄热一体超异种计算都可以“解决”AI大计算力困境的蓄热一体架构,融合了记忆和计算,打破了传统架构下的三大壁垒。彻底消除了访问延迟,这将大大降低电力消耗。同时,由于计算与存储完全耦合,因此可以开发更细粒度的并行性,从而实现更高的性能和能源效率。超异构计算是一种计算,它可以整合和重建更多的异构计算,从而通过在各种类型的处理器之间充分和灵活地进行数据交互而形成。简单地说,结合DSA、GPU、CPU、CIM等多种类型引擎的优势,实现性能飞跃的DSA负责相对确定的大计算量的工作;GPU负责应用层一些性能敏感且具有一定弹性的工作;CPU可以做任何事情,负责备份; CIM是内存计算,超异种和普通异种的主要区别在于加入CIM,从而可以实现同等的计算能力,更低的能耗;同等的能耗,更高的计算能力。另外,CIM由于装置的优点,可以承担比DSA更大的演算能力。亿铸科技创始人、算一体型AI大数芯片的熊大博士说,其优点有两个方面。一个是系统层,可以优化整体效率;二个是软件层,可以实现跨平台架构。亿铸选择结合两项技术,即“蓄算一体超异种”的想法,在与苏母的“系统级创新”一致的ISSCC2023中,苏母提出了系统级创新概念,即从整体设计上和下游的多个环节共同设计完成芯片性能的提升。并且,使用这个概念,提示实现数位数的效率提高的事例。也就是说,如果同步使用内存统合、芯片Chiplet、3D封装等技术,就会带来不同的效率提高,突破性能瓶颈的可能性很高。亿万富翁之所以提出这种革新度较高的构想,也是因为其充满了潜力。亿铸科技拥有实力雄厚的研发、工程和团队,其核心研发团队成员均来自国内芯片大学,毕业于斯坦福大学、哈佛大学、上海交通大学、大学和中国科学大学等。研发能力涵盖工艺器件、架构设计、电路设计和软件生态等全链;其工程团队核心成员平均具有25年以上的高端集成电路设计和量产经验,具有丰富的应用和产品化实战经验。在此基础上,作为最初的存储计算一体超异种概念的亿铸科技,如果能够组合提出独特技术构想的新型存储器技术RRAM、存储计算一体架构、核心粒子技术Chiplet、3D封装等技术,就可以实现更大的有效计算能力,配置更多的参数。实现更高的能效比,实现更好的软件兼容性,从而提高人工智能大计算芯片的开发天花板。

(关于存算一体+超异形做AI大算力芯片的技术畅想图片源:亿铸科技)一方面,ChatGPT等大模型的发展对算力提出了史史无前例的要求,吞噬着算力与能源;另一方面,ChatGPT也为存算一体架、超异形等技术带来核级推动力。大公司和初创公司都在“努力”突破计算能力的瓶颈。亿铸科技拥有最适合最大计算能力的器件RRAM,再加上3D封装和Chiplet等技术,熊大鹏博士表示,亿铸科技可以为解决记忆墙、能耗墙等问题带来杀手级的硬件解决方案。在摩尔定律基本结束、ASIC、FPGA和GPGPU架构能效比难以提高的今天,亿铸科技率先提出了“存储计算一体型超异构架构”这一全新的技术发展路径,为我国AI大计算力芯片的进一步发展增添了新的动能。