浅谈国产GPU发展

时间：2022-09-24 15:10:15人气：次作者：快盘下载我要评论

浅谈国产GPU发展

最近几年大芯片投资赛道，数GPU热得发烫。一众初创公司涌现，大厂精英抱团创业，巨额融资不断刷新行业纪录。一些成立较早的企业，已经进入研发落地阶段，刚成立不久的厂商，也旋风般推出相关产品。与GPU创业高热相伴的，是从未间断的质疑声：估值虚高，PPT发布，套壳马甲……一些国内GPU创企推出的产品，被认为已经背离了芯片研发规律，成为融资的工具跳板，后生们不讲武德，坏了规矩。

国产GPU创业领域目前存在哪些问题？应该以什么样的态度发展国产GPU？与海外巨头相比，有何差距与挑战？追赶的机会在哪？集微网同产业人士进行交流，探寻国产GPU创业浪潮风起云涌的背后。仔细丈量国产GPU的“成色”，或许有助于更加清醒地正视现实。

一、乱象丛生泥沙俱下

近两年，受市场需求以及政策、资本的推动，GPU在国内受到疯狂追捧。地缘政治、大国博弈背景下，相较于已有一定积累的国产CPU，国产GPU的破局更具紧迫性和必要性。人才储备程度，科创板提供的退出机制，也为国产GPU的发展创造了良好契机。于是，GPU成为继AI之后，最为性感的芯片投资赛道。资本的蜂拥而至吸引了来自英伟达、AMD、海思、高通等一众大厂精英创业。据不完全统计，目前该领域的初创企业已近20家，所有一线投资机构均参与其中。谈及目前国内GPU创业领域的现状，行业人士李明（化名）认为赛道过热且拥挤，市场鱼目混珠、泥沙俱下。

李明并不否认看到一些企业推出的产品，不管是在跑分还是在标准测试和应用方面都取得了进步，但也有不少产品和演示目前还处于“PPT”状态。对于那些成立一年左右就推出多款产品的公司，在行业摸爬滚打了20多年的李明称“颠覆了自己的行业认知”。

“一块GPU芯片的研发周期从立项到上市至少要3～5年，好的芯片要经过架构和应用打磨，这个过程也不可能低于两年。有的产品宣称是自主设计，但明显违反整个芯片的设计规律。GPU不可能一年半载就设计出来并跑通应用，有可能设计全是外包，或是将已流片的设计的Spec配置稍作修改。”李明分析称。

另一位GPU企业高管王强（化名）认为，一些GPU新势力尚没有明确自己的细分市场，也没有想清楚未来长远的发展方向，只会用PPT吹牛，发布产品参数和性能对比时混淆视听，实际并不能够正常量产或进行流畅演示，真实性和可靠性大打问号。“有的芯片参数比较奇怪，宣称算力是6T Flops/s，存储能力是50GB/s，两者的比例达到120：1，但实际上GPU最理想的比例应该是25:1，这在应用层面非常尴尬，不知所用何处。此外，有的芯片带宽非常低，无论是用于AI计算还是图形，基本上都发挥不出功能。”谈及诸多费解之处，王强直摇头。

行业看来，这样导致的结果是搅乱了市场，浮躁了人心，在GPU这样一个高门槛且重积累的领域，不讲诚信，违背市场、技术规律，待潮水退去后，只能是一地鸡毛。

二、资本裹挟蒙眼狂奔

GPU创企在产品上的乱象丛生，在行业投资人士张帅（化名）看来，有些是迫不得已。“海思做GPU，前后花了4年半，在华为强大流程体系支持下尚且如此，初创企业难度更大。如果也做这么长时间才出产品，投资人不会答应。”张帅说。据张帅透露，有的GPU初创公司与投资方签下对赌协议，在某个时间点推出芯片产品，是决定其拿到下一轮融资的入场券。

资本裹挟之下，一些配置错误、不合逻辑、完全不像正常产品的GPU芯片横空出世，冠以自研、国产、打破垄断之名。吃瓜群众亢奋，行业人士错愕。“很多国内GPU的研发，其实已经脱离了芯片开发的初衷，所有的成果展示和发布，其实是以融资为目的。”创道投资咨询合伙人步日欣直言。

赛道的火热以及大规模的融资助推GPU初创企业估值一路走高。一些成立一两年的热门企业，估值已经达到两三百亿元，GPU成为高估值代名词。不少业内人士呼吁，对于那些通过“放卫星”博眼球的方式来吸引关注的可疑产品公司，需要投资人和相关的市场机构进行甄别以及理性对待和评估。

北科建集团产业运营负责人李锴表示，国内GPU从整体而言，受到了政策推动的影响，有了积极进展，尤其包括“东数西算”政策、算力芯片和智慧化应用的市场打开。但目前阶段的投融资热度，还是一种行业聚焦惯性投资，依靠当前的政策性红利，大部分投资标的还属于高风险投资项目。“真正投进去，一是要考虑估值是不是虚高的问题，二是需要专业性的知识背景和能力，考验投资机构慧眼识珠的本领。”李锴说。

但独具慧眼似乎是少数，GPU赛道的玩家更多处于“蒙眼狂奔”中，几年过去，投资热度仍未消减。

张帅不否认GPU赛道过热，但他并不认为GPU创企估值过高，因为在他看来GPU的价值摆在那。“如果真的中美脱钩，高性能GPU被卡脖子，中国一定要想办法替代。一个GPU工程师年薪50万，2000人的企业，人力一年就要10亿，每年二三十亿的整体开支跑不掉。投资方愿意投钱给不同的创业团队也有道理，谁都想赌一把中国的AMD和英伟达。”张帅说。

三、图形/计算花开两朵

GPGPU、通用GPU、全功能GPU、图形GPU、渲染GPU、GPU+……在国内，GPU命名上的文字游戏已被厂商们玩坏，也让外界对这些产品一时云里雾里。按功能划分，GPU主要分为侧重图形图像的渲染GPU和侧重通用计算的GPGPU。目前国内初创GPU公司，结合自己的优势和阶段性定位，分别采取了不同的切入路线。其中GPGPU公司包括壁仞、沐曦、登临、天数智芯、红山微电子、珠海芯动力等，渲染GPU企业包括摩尔线程、励算、深流微、瀚博、芯瞳、格兰菲等。

沐曦CTO杨建博士指出，GPGPU相当于大算力芯片，是传统计算的回归，GPGPU的创新等同于将一些专用加速功能变成GPU的一组指令集，芯片面积只有原来的1%-10%，却相当于实现了一个全新专有芯片的加持，同时具备通用计算的性能，这使得边际成本更低，更具价值。

而渲染GPU约80%仍是GPGPU部分，20%则是固定渲染流水线（fixed function），例如geometry pipeline、rasterization pipeline等。固定渲染流水线涉及较多的数学公式，因此比较依靠编译器和驱动等软件能力，而GPGPU在硬件和应用层面较为复杂。“从软硬件复杂度看，渲染GPU复杂度更高。从开发人员团队数量来看，GPGPU如需要200人的硬件团队，渲染GPU可能要再增加50人，但软件开发人员相比GPGPU或需增加三倍，需要更多的人员开发驱动和编译器等。”杨建说。

芯动科技首席SoC架构师何颖认为，图形渲染GPU因为经过了十几年的演化进程，流水线长，实现起来复杂，设计上的挑战更大，同时存在很多专利陷阱。“芯动科技目前聚焦于渲染GPU领域，但GPGPU也在规划之中，芯动科技选择的是一个起步很难但可以走得很远的赛道。虽然GPGPU的价值很高，增长也不错，但图形渲染GPU在细分市场总的体量更大。”何颖告诉集微网。但杨建认为，对于一家初创公司的首颗GPU产品来说，如果要同时自研渲染GPU的固定渲染流水线IP、统一着色器（shader）IP，需要的时间和人力成本将非初始的几百人团队可以承受。因此，沐曦采取先做GPGPU，再发展图形渲染GPU的模式。在自研GPGPU中，只有统一着色器IP，不需要固定渲染流水线，这样可以在自研GPU的道路上一步一个脚印稳健前行。

四、核心IP 十年差距

任何一款高端芯片的打造，都离不开基石——IP的“成全”，IP的质量很大程度上决定了国产GPU性能的底色。

在步日欣看来，GPU作为高性能的大芯片，想在短期内出成果，必然需要依赖外部IP。国产GPU厂商能够快速推出相关产品，很大程度上依靠外购IP。

但打着自主研发之名，行外购之实，推出“马甲”产品就难免有忽悠之嫌，这样的案例在芯片领域本就不在少数。自研IP越多，芯片设计上越有把握，产品的差异化更明显。但相对而言，资金、人员、时间上的成本投入也更高。王强告诉记者，GPU IP自研需要36-48个月以及200个工程师，而采用外购IP的方式，可以减少12-18个月开发周期。

李明则表示，考虑到GPU的研发非常考验项目的目标管理能力，对于团队能力和组织工程能力要求很高，初创企业由于能力有限，短期内如果自研路线不顺利，会选择大量外购IP或“马甲”路线。但从长远看，公司团队的成长、市场定位以及盈亏平衡不能得到保证，而且会逐渐拉开跟行业领先公司的差距。

据集微网了解，GPU 的IP主要涉及三大类，一是模拟IP，包括PCIe、Displayport和HDMI等等，这方面国内厂商占有率较低；二是Memory；三是数字IP，包括基于Arm或RISC-V的微控制器IP、编解码芯片IP以及最核心的GPU IP等。核心IP国内有Imagination、芯原、格兰菲等厂商，相对而言，Imagination认可度较高，芯原是后起之秀，而格兰菲主要面向特定领域用户。在李明看来，国内核心IP能力至少比英伟达、AMD等落后十年左右。而整体而言，GPGPU企业与国际大厂技术差距约3年，渲染GPU与国际大厂差距约10年左右。

李锴认为，国内GPU底层技术空白点较多，IP大多受制于国外厂商，产品前端稳定性不理想，目前又很难在主线中高端电子产品上得到普及化应用，需多年沉淀形成自主IP积累才能具有一定替代性。需要指出的是，外购IP并不意味着无法自主可控，但对GPU企业的能力要求很高。据何颖介绍，芯动科技与Imagination的合作是与苹果一样的架构授权，基于该初始架构芯动科技探索了很多自己的方案，包括自研的Cache一致性Innolink Chiplet技术，内置国产物理不可克隆iUnique Security PUF信息安全加密技术等。“芯动科技去年推出的渲染GPU‘风华1号’80%以上的IP都属于自主研发。既然已经获得了架构授权，芯动科技就可以不受限制地自行改进，能够做到自主可控。”何颖说。

五、生态之路道阻且长

除了硬件性能上的比拼，高性能芯片的生态搭建也是绕不过去的一道坎儿。某种程度上，生态比硬件更重要。步日欣表示，在最终量产和商业化产品出来之前，国产GPU还没到谈论生态和应用层面的地步，而杨建认为，GPU生态是除产品外初创企业能否活下来的重要因素，是一开始就要考虑的问题。

对于渲染GPU和GPGPU而言，构建生态的难度截然不同。渲染GPU在技术层面来相对复杂，但是好处在于有很多业界成熟的标准的API，如OpenGL、OpenGL ES、DirectX、Vulkan等。只要打通了整个驱动程序层和编译器生态，就基本完成90%。

而在GPGPU领域，几乎是被英伟达一手打造的CUDA生态所垄断。“GPGPU的生态非常复杂，要求一路打通到应用层，提供面向所有应用的全面支持，甚至要自主开发以支持一个新的应用领域。”杨建指出。虽然不少GPU初创公司推出的产品都号称兼容CUDA生态，但李明认为存在兼容多少的问题，水分较大，比较重要的特性中可能60%-70%都无法支持。

而据了解，兼容CUDA并非易事，需要投入工程师的数量巨大。涉及50个驱动、50个编译器、50个数学库、300个应用层工程师，3-5年的时间。功能的验证，用户的培养需要额外3-5年，每年还要至少开支1000万-3000万元资助外部开发者。“使用的人越多，生态越占统治地位，看看国内的初创GPU企业，哪些是已经开始编写教材、在高校开课和开展合作项目、组织比赛等做这些人才培养方面的工作，就知道谁真正在沉下心来做生态了。”李明说。

何颖指出，国产GPU业应采取开放合作的心态，学会站在巨人的肩膀上，善于利用现有架构和生态，设计契合市场需求的优秀产品，打造全球化设计水平的开发团队。国产GPU在起步阶段兼容现有生态更容易发展，先求生存；长期还是要摆脱兼容思路，站稳脚跟后再求发展自有的核心技术。在GPU生态中，软件的权重已越来越高。Imagination中国区战略市场与生态副总裁时昕博士提及，GPU软件极为复杂，包括各种图形API和计算接口、基础库、与上层应用对接适配等等，开发工作量巨大。从应用角度来看，国内GPU生态的发展更需要“众人拾柴”。时昕认为，要加快打造国产GPU产业链，下游的整机厂商需要对国产GPU给予更多包容。

“国产GPU可能99%已达标了，如果能帮助国产GPU厂商一起将这百分之一影响体验的最后一步补齐，做到更完善，这对其发展是非常重要的。”时昕强调。

六、掘金市场盈利维艰

对于GPU创企而言，巨大的研发费用和资本开支是必需，但长期、持续的利润支撑才是GPU跨代发展的强劲驱动力。也就是说，GPU的成功和成熟需要大量的验证和出货，这就需要国产GPU厂商瞄准目标应用市场发力。步日欣认为，对于初创企业而言，渲染GPU涉及到生态建设的完善度，所以从信创、军工、工业等领域切入较为稳妥。而GPGPU市场从人工智能、服务器、高性能计算等领域切入是最优选择。

但初创GPU企业掘金市场的现实却相对骨感。

比如，在渲染GPU的传统应用如视频、游戏等领域，英伟达和AMD构建的护城河可谓固若金汤，国内企业与之差距较大，而且这一市场全球容纳三四家都比较困难。短期看，虽然国内信创市场提供了一定空间，但总量不大，且偏向于中低端。因此，如何分食这一“蛋糕”之下还能实现正循环，是国内渲染GPU厂商面临的问题。从中长期看，虽然云端渲染成为新的增长点，但元宇宙、云游戏、云手机等市场普遍认为将在2024年前后起势，因此当下如何获得盈利求生存也是艰难挑战。

而在GPGPU方面，比如在AI计算领域，则面临场景应用复杂且碎片化，以及国内众多竞争对手混战的局面。何颖认为，游戏、3A大作对GPU的图形和计算相对要求比较全面，国内企业在Windows领域追赶难度较大，但在安卓手游、信创桌面和某些定制的服务器领域，以及自动驾驶领域，国内厂商有机会实现切入。目前，芯动科技的风华系列GPU瞄准国产信创桌面和服务器这两大细分领域。相较于信创市场，服务器显卡单价更高，实现盈利较有希望。

而杨建则指出，除生态之外，当下对于初创GPGPU企业生存而言，最大挑战是产能。

“目前和AI相关的大芯片，因为需要Cowos等先进封装，所涉及的中介层原材料非常紧缺，在目前产能吃紧的情况下，对于已经推出一些产品的初创GPU企业，会面临短期盈利的问题。”杨建说。

七、弯道超车路在何方

我国在高端GPU领域缺席多年，面对海外巨头固若金汤的专利、生态等壁垒，GPU业从战略布局成长为核心支柱，显然还有漫长征途。行业人士看来，国内GPU企业发展破局的关键在于找准定位，贴近市场。

何颖特别强调，国内的渲染GPU厂商应该着重于贴近市场的定位和创新，使得设计和能效能够贴近应用，力争在专有应用领域或局部领域实现突破，然后再进一步拓展和打磨经验和能力，使得最终在生态和应用上能跟技术创新良好结合，形成正向循环。“跟国外巨头相比，国产GPU在一些专用领域优化方面，并不是完全亦步亦趋。通过在这些领域发力，能够在计算密度或在工艺、节奏、带宽密度等面体现出差异化，可以使产品在性价比，在某些特种应用方面能够达到国外GPU的能效，甚至做得更好。”何颖说。杨建则表示，在GPGPU方面，英伟达没有百分百的优势，国内GPGPU在某些方面可以说是超越的。国内厂商在HPC和服务器、通用计算等领域可以依托Linux的开放性和可控性强的优势，实现有效突破。在杨建看来，国内GPU厂商的最大优势在于本土支持。

“如果整个市场是一个地图，国内GPU厂商可先撒点，针对一些特定市场循序渐进抢占生态，加强与国内厂商的紧密合作，积累一定的优势和声誉后，再由点及面布局寻求突破。”杨建建议。

多位受访者提及，高端芯片研发周期长、投入大，没有足量资金支持无法取得成功，但过度的投资热潮容易滋生投机现象，互联网投资的模式并不适用于芯片领域，国产GPU要谨防重蹈AI芯片的覆辙，需要正视差距，脚踏实地前行。“烧钱的模式是难以为继的，只有踏踏实实服务客户，服务市场，并且能够不断的回收研发成本，进一步实现创新，才是国产GPU的成功之路。急功近利，疯狂招人，疯狂烧钱的模式，实际上不可能快速弥补国产GPU跟国外GPU之间的差距，因为国外的GPU是一个个应用打磨出来的，国产GPU一定要有耐心，才能够在这个领域实现创新和弯道超车。”何颖说。

步日欣指出，国内GPU距离国际大厂还有很长的距离，特别是目前的竞争格局下，国内GPU还处于野蛮生长阶段，虽然资本市场较为关注，但同质化竞争和创业造成了很大的人才和资金的浪费，一定程度上制约了国产GPU的发展进程。“下一步这几十家GPU企业，肯定要面临一定程度洗牌，那个时候才是真正的国产替代、缩小差距的开始。”步日欣说。

文章分享自微信公众号：