手机AI竞争转向:苹果、vivo等厂商不再“堆参数”,押注轻量化端侧大模型

在生成式AI(人工智能)席卷全球的浪潮中,智能手机正成为AI落地的关键阵地。从苹果推出Apple Intelligence、三星发布Gauss(高斯)、荣耀带来MagicGUI大模型,再到vivo的蓝心大模型端侧AI正成为行业新一轮技术竞赛的焦点。相比云侧AI,端侧AI既能保护用户隐私、降低计算与能耗成本,还能提供类似个人助手的交互体验。

然而,当AI从云端迁移到终端,技术与商业的难题也随之而来。过去两年,厂商们热衷于将大模型直接嵌入手机操作系统,并将参数规模当成竞逐的焦点。比如,vivo曾在2023年实现130亿参数的“蓝心大模型”在端侧跑通,并让70亿参数模型在端侧落地。

然而在今年10月10日举办的vivo开发者大会上,vivo副总裁、vivo AI全球研究院院长周围给出了一个新的发展方向——放弃对“通用人工智能”的追逐,转而推出体量更轻的3B端侧多模态推理大模型,该模型仅占用手机2GB内存、功耗约750毫安,却能在推理能力上超过此前的7B甚至10B模型,性能接近云端模型。“做千亿级模型需要两万卡以上的集群,光设备投入就20多亿元,这还不包括每年数亿元的电费。‘卷’通用人工智能不太现实。”


vivo副总裁周围 企业供图

事实上,端侧模型的小型化正逐渐成为行业共识。苹果的Apple Intelligence同样采用30亿参数的设计,可以在设备上完成文本摘要、信息提取与跨应用操作等任务。这意味着,厂商们正在从“堆参数、拼算力”的竞争,转向关注模型在端侧实用性能、功耗控制的理性阶段。

告别模型参数竞赛

端侧大模型落地后,越来越多消费者开始应用大模型,这也有望为手机消费带来新的增长契机。华福证券在研报中称,端侧大模型将成为消费电子品牌厂商提升个性化用户体验,打造产品差异化竞争力的重要方向,具备更强AI能力的终端新品推出或将带动消费电子见底复苏。

在vivo AI产品总经理关岩冰看来,真正实现个人化智能的核心在于端侧。“只有端侧模型才能实时分析用户的数据、洞察需求,感知屏幕内容、理解使用意图等。”这也正是苹果在“Apple Intelligence”中强调的方向,即在端侧完成敏感数据处理,保障隐私,同时提供个性化服务。然而,与苹果封闭的体系不同,安卓阵营的厂商在落地端侧大模型时要面临众多挑战。

“云端模型的CPU通常基于X86架构,而手机上是ARM的内核,此外还要兼容不同芯片厂的NPU指令集,如何把原来生态里指令集转成手机上的指令集,这里最大的障碍是算子。”周围说道。据他介绍,vivo早在2017年便在美国设立AI研究院,组建专门的算子团队,目前该团队已扩展至几十人,聚焦把模型转成端侧化的过程。

算子之外,内存占用同样是制约端侧大模型落地的关键瓶颈。周围举例称:“以往7B模型需要占用3.5G内存,而8G手机是中高端机型的主要配置,一个大模型就占掉4个G内存,一下让高端机变成了低端机。”推理能力则是另一个挑战。例如,执行一个查询任务:“帮我找今天下午4点北京到深圳的机票哪一个最便宜”,实际会涉及几个App比价、分析使用习惯等复杂问题。“去年的70亿参数模型只能做简单的任务拆解,不能做复杂的推理。”周围说道。

过去一年vivo针对这些问题进行了优化。vivo推出的3B端侧多模态推理大模型只占2G内存,不影响高端机的性能,其次增强了推理能力,可在手机中做意图中控和任务拆解的中台。“今年30亿参数的模型已比去年100亿参数的模型更强,甚至在部分任务中与云端模型差距仅在2%~3%之间。”周围说道。这意味着,在文本摘要、多轮对话、意图识别等场景中,端侧模型已具备实用价值。

智能体跨应用调度受限

随着端侧算力提升和操作系统AI化,手机中原有的语音助手逐渐向具备执行能力的“智能体”演进——它不再局限于回答提问,而是被赋予更强的意图理解与任务执行能力。厂商希望其能成为真正意义上的个人助理,完成诸如“帮我订一杯拿铁,少冰”这类需要调用外部服务、理解上下文并执行多步操作的实际任务。

目前AI手机智能助手调用第三方App,主要有两条技术路线:一是通过意图框架实现。通过API(应用程序编程接口)调用应用,实现跨应用功能。具体来说,就是手机厂商与App开发企业协商、以合法API的形式接入;二是“纯视觉方案”,无需第三方App同意,直接调用安卓系统的无障碍等系统级权限。具体做法是,安卓手机厂商以多模态大模型技术配合无障碍权限,先读取屏幕内容,再以模拟用户点击的方式代替用户操作,实现手机智能助手代替用户接管手机,以达到调用App功能的目的。

“用户用手机,手机厂商只占了15%的时长,还有85%的时长是用于开发者提供服务,特别是头部的互联网厂商,又在这85%中占了70%~80%,他们的参与度非常高。”周围说道。这也导致智能体在跨应用调度服务时处处受限,互联网巨头掌握着绝大多数用户服务接口和数据,而手机厂商掌握着操作系统与硬件能力。双方在安全授权、用户隐私和收益分配上的界限尚未明晰。

周围坦言:“当手机的智能体要做任务的时候,我们只能做自己的功能和应用,比如是否流畅、调亮度、连Wi-Fi等,如果想跨应用操作,还需要和对方(互联网厂商)讨论安全授权的标准。”

在他看来,破局的关键在于推动行业标准的建立。“我们无法避免地要做用户习惯和服务的分发,接下来的策略是建好能力,其次,愿意跟我们握手、合作的,就坐下来商量。AI时代到来,是否需要一个新的江湖地位和影响力,就留给时间来回答。”

Published by

风君子

独自遨游何稽首 揭天掀地慰生平