上证报中国证券网讯(年悦记者张雪)在AI算力需求爆发式增长与国产化替代加速的双重背景下,国产高端处理器领军企业海光信息(688041)正迎来前所未有的发展机遇。
在5月28日至31日举行的智博会上,海光信息(688041)总裁助理兼智能计算产品部总经理杜夏威、光合组织嵌入式产品专家张考华接受了上海证券报记者采访,围绕Token经济效应、CPU价值重估、边端AI布局及国产算力生态建设等热点话题,分享了战略思考。
Token效益时代算力衡量尺度变了
进入Token效益时代,衡量算力价值的标准正在发生根本性变化。
杜夏威提出,Token有一个非常重要的作用——它把算力和模型算法之间的度量衡统一了。这意味着产业可以围绕Token这样一个统一的度量衡,来探讨人工智能(885728)和算力产业的生态发展。他进一步区分了两个核心维度:算力指标反馈芯片自身能力的“天花板”,而Token吞吐力衡量的是将算力转化为业务效能的实际能力,这两个指标要并重去看。
面对当前行业普遍的“Token焦虑”,杜夏威给出了辩证的视角:“焦虑未必是坏事。如果大家对Token和算力没有感知,自然不会焦虑。大家都在焦虑,说明产业正在快速流动。”他认为,要解决焦虑,一方面要健全国产算力生态,提升算力到Token的输送效率;另一方面要帮助用户实现原有业务的Token化转型。
张考华则从算力分层的角度补充了Token效益的实现路径。他表示,随着DeepSeek等大模型带来的“算力热”,Token需求呈爆炸式增长,但这种需求不能全部传给数据中心或云端。“以后整个AI越来越广泛应用,边端的算力要求很多。有些东西可以传到云端,有些可以就地计算。”张考华说。
他以“算力上天”为例说明,星际探索中的算力无需全部传回数据中心,否则数据通道压力巨大。“未来的Token需求应该是分级的,有些就近计算,有些可以往算力中心去。这样会让AI发展更加成熟。”这正是海光推出面向工控及半嵌入式场景芯片的战略考量——为边端算力提供坚实的芯片底座。
算力“下半场”开启
如果说以数据中心训练为主的AI是“开场大戏”,那么边端AI与CPU价值重估共同决定了这场大戏能走多深、影响多广。
张考华表示,随着AI技术的深度演化,算力正从中心算力向外延展至边端。“未来整个AI能发展成什么样,能有多少精彩内容呈现,能对生活影响多广,更多的要看边端。边端的算力未来会发展得非常广泛,对芯片的需求会非常多。”正是基于这一判断,海光信息(688041)推出了面向工控及半嵌入式场景的芯片。
针对过去国产工控芯片“能用但不好用”的刻板印象,张考华回应称,这是一种“思维惯性”。他介绍,海光的C86芯片完整继承了成熟的X86技术路线,经过在高端服务器及超级算力领域的深刻打磨,技术已非常成熟。技术下移到嵌入式领域后,在内生安全、宽温支持、恶劣户外环境适配等方面都做了充分设计。
与此同时,CPU在数据中心的作用正被重新定义。杜夏威表示,大模型和Token化带来了用户群体数量级的增长,而要实现算力在各行各业的触达,不能完全依赖昂贵的AI芯片或算力中心。
无论是在数据中心端支撑模型推理与训练,还是在CPU与GPU协同调度的各类场景中,CPU都扮演着不可或缺的角色。随着大模型参数量持续扩大,MOE成为主流架构,KV Cache及部分算力不得不卸到Host端的CPU上,CPU的需求持续走高。在服务模式上,海光正通过云上算力与私有化方案结合,形成“云端协同”的完整覆盖。
在开放生态方面,杜夏威表示,海光CPU不仅与自研DCU搭配,也与生态内多种AI芯片完成了产品化组合,并与多家伙伴合作推出AI终端和工作站。
