手机厂靠拢豆包

努比亚 M153的三万台还没有卖光,豆包的手机端合作版图,有望进一步扩大。

近日,界面新闻报道称,字节跳动正推进与 vivo、联想、传音等硬件厂商开展 AI 手机合作,为其设备预装 AIGC 插件;多位 vivo 员工向媒体证实双方已确认合作、正在讨论细节。

不过,仅凭这条消息模糊的表述,尚无法确认这些“合作”的具体性质,是否和此前字节与中兴的合作方案划等号。此前,在 nubia M153上,字节在手机 OS 层深度构建了 GUI Agent,可以自动接管用户指定的跨 App 操作,但随后遭受了来自微信、淘宝等 App 的“反制”。

但从最新合作传闻中不难看出,M153的尝试还是吸引了手机行业的目光。随着字节带着豆包大模型能力入局,终端厂商的原生 AI 生态正在加速扩张。

这一趋势,在近日举办的火山引擎 FORCE 原动力大会上可以窥探一斑。

包括中兴、荣耀、小米、vivo 在内的多家手机厂商为火山引擎“站台”。不过,除 nubia 带来的 M153之外,大部分手机厂商和豆包的关系更多是模型能力的调用,Agent 层面的产品形态、交互方式以及系统级整合,依然主要由手机厂商主导。

在本届源动力大会的群访环节,火山引擎总裁谭待在接受直面 AI 采访时表示,“AI 的价值在于用更方便、更便利的方式,做大用户的需求”。

显然,不管后续字节和这些厂商的合作如何展开,一个行业趋势已经愈发清晰。系统层的 Agent 潜力巨大,即便当前落地存在一些阻力,但在 M153上已经能看到未来的雏形。

不管是合作还是自研,大模型厂商和手机厂商们,已经喊着“做大做强”的口号,加速涌入这一赛道。

A

手机厂商们加速拥抱字节等大模型厂商,背后是手机端原生助手领域,有着天然体量巨大的活跃用户基础。

QuestMobile 的2025年三季度报告显示,截至2025年9月,移动端 AI 应用 MAU 达到7.29亿;其中“手机厂商 AI 助手”规模约5.35亿,“原生 AI App”约2.87亿,“In-App AI”约7.06亿。

换言之,在原生 AI 的不同形态里,终端和 App 有着明显的用户“层级差”:原生 AI App 依赖用户主动点击触发,而系统级助手天然就在“随手就用”的前置位,甚至无需用户刻意点击就能维持日活。

事实上,围绕“如何在系统层唤起 AI、如何让助手不只停留在语音问答”的探索,几乎已经成为国内主流手机厂商的共识,只是受限于模型能力与工程稳定性,多数方案最终停留在“增强版语音助手”的阶段,而豆包手机助手的出现直接踢开了这扇大门。

尽管nubia M153呈现的效果在业内仍有争议,但豆包手机助手在 OS 层获得授权后,实现了自动接管用户的跨应用任务,让业内看到了完全体 GUI Agent 的雏形。这一形态带来的想象力空间,并不会随着部分超级 App 的“反制”而消失。

另一方面,随着近两年大模型在指令理解、多轮规划与工具调用能力上的明显跃迁,AI 首次具备了承担复杂任务链的可能;与此同时,移动端算力、内存与本地推理能力的持续提升,也让“端侧执行”不再只是概念。

手机端“可跑得动”的关键之一,是移动 SoC 的 NPU 峰值算力与能效在近两代出现跃升。根据行业调研机构 Counterpoint 的分析,2025年全球主流旗舰级 SoC 几乎全面支持生成式 AI,本年度出货的高端 SoC 中有约88% 已具备生成式 AI 能力,且这些芯片的 AI 算力峰值在2025年已经接近100TOPS级别,约为2021年水平的四倍。

AI登“机”的浪潮下,Siri 时代那种以固定指令为主的语音助手逻辑,已经难以满足用户对“智能”的期待。

在这样的窗口期下,手机厂商迫切需要在硬件与系统层面,寻找新的体验突破口;而 AI 云厂商,则拥有更成熟的模型与工程能力。双方的靠拢,并非一次偶然的商业试探,而是技术成熟度与产业需求叠加后的结果。

这也是为什么,尽管 M153的销量规模有限,但3万台工程机,仍像是一枚信号弹,给早已蠢蠢欲动的手机行业一个冲锋的信号。

这样的背景下,市场开始传出 vivo 等体量更大的厂商,与字节推进合作的消息,其实合情合理。这并不意味着所有厂商都会复制 M153的深度定制模式。vivo 此前就发布过“蓝心智能”AI 战略与自研蓝心大模型矩阵,并强调 OriginOS 与系统级智能体能力的升级。

另一边,以荣耀为例,YOYO Agent 已接入豆包大模型的部分能力,但 Agent 的训练、产品逻辑与系统整合,依然由荣耀主导完成。这种“能力接入而非产品外包”的方式,或许才是更多手机厂商在当前阶段的现实选择。

值得关注的是,荣耀首席影像工程师罗巍,此前曾就豆包手机助手发表个人观点:“因为字节没有硬件研发能力,或者硬件能力并不比中兴领先。那么就是两个矮子在一起,也不会生个高子。”

但在这番评价之后,荣耀的展台仍然作为火山引擎合作伙伴,出现在了本届原动力大会上。

回过头看,字节的这次激进,并不是脱离产业节奏的冒进,而是踩在一个已经逐渐成熟的窗口期上。M153的意义,也并不在于证明某一款产品的成功,而在于让行业更坚定地看到:端侧Agent,已经成为一条无法回避的路径。

而面对微信和淘宝等App不断筑高的城墙,App与Agent的关系,成了绕不开的下一问。

B

豆包手机助手面世以来,在业内迅速引发了一些讨论:当 AI 可以直接理解意图并代为操作,Agent 是传统 App 的威胁吗?

在本届火山引擎原动力大会的群访环节,谭待回应了直面AI提出的这一问题,他首先从用户视角进行了阐述。

“假如说用户想点一杯咖啡,点咖啡这个操作不管是通过跟机器人语音交互,还是操作手机完成,最后都是为了满足用户的需求。”在他看来,普通人还有很多需求没有被满足,通过 AI 可以更好地解决这些问题。

“至于这个 AI 的载体是 Web、App、agent,还是套了个 App 壳的 agent,可能没有那么大关系。”谭待这样说道。

所以,回到手机原生助手层面,能操作多少 App 也许从来不是问题的核心,真正重要的,是 AI 是否能用更低的使用成本,把原本未被满足的需求释放出来。当需求被“做大”,无疑在硬件层面可以建立起全新的用户心智,尤其是广大用户对 AI 已经并不陌生的2025年。

QuestMobile 数据显示,截至2025年第一季度,原生 AI 应用的月活跃用户规模大幅扩容,其中用户对 AI 原生应用从“尝鲜”逐渐转向“依赖”,其人均月使用次数同比增速明显高于使用时长增速。

报告显示,AI 原生应用的月人均使用次数同比增长约53.1%,而月人均使用时长则增长约32.7%,用户层面倾向于多次短时打开 AI 应用去完成即时类需求。

这些需求,正是手机原生 Agent 可以放大的那部分。但这本质上是一个增量逻辑,并不意味着 App 的价值短期内会被快速削弱。

中国信通院在2024年发布的数字应用生态报告指出,用户使用时长仍高度集中在少数头部 App 上,支付、即时通讯、短视频等核心应用合计占据超过八成的用户总使用时长。这些 App 所承载的账户体系、支付能力、内容供给与安全责任,短期内都不具备被 Agent 直接替代的条件。

也就是说,Agent 正在改变 App 的“入口位置”,而非消解其存在价值。

在这一结构中,App 仍然是能力与服务的封装体,但不再必然是用户表达需求的起点;Agent 则逐渐承担起“需求调度层”的角色,负责理解意图、拆解任务,并将执行分发给不同应用或系统能力。

甚至,用户驱动 Agent 的终端甚至未必是手机。

根据 Counterpoint Research 的追踪与分析数据,2025年智能可穿戴设备市场中 AI 智能眼镜等具备本地 AI 能力的终端表现出显著增长势头。2025年上半年,全球智能眼镜出货量同比增长超过110%,其中 AI 型智能眼镜的出货占比大幅提升,反映出业界对本地 AI 能力的快速采纳趋势。

而在这一背景下,字节也不会是唯一入场的大模型厂商。

智谱 AI 在近期将其核心 AI Agent 模型 AutoGLM 开源,使研究者与开发者能够基于该模型构建具备“Phone Use”能力的 AI 终端智能体。

AutoGLM 能够理解屏幕内容,并通过模拟用户操作(如点击、滑动、文字输入等)完成多步骤任务流程,目前已在微信、淘宝、抖音、美团等超过50个高频中文应用场景中展示出自动化操作的能力。

换言之,当更多大模型厂商试图“上机”,分水岭就不再只是模型接入,而是手机厂商是否愿意把系统层的 AI 入口与规则让渡出去。下一阶段的竞争,更像是“系统与生态”的较量。

C

如果说 nubia M153更像是一种“工程验证”,那么在它发布数周后,小米在人车家全生态大会上同步披露的澎湃 OS 与 AI 进展,则代表着传统手机豪强的同步跟进。

在这场大会上,小米并未将重心放在单一模型或功能上,而是反复强调澎湃 OS 作为系统级底座的角色——它正在成为连接手机、平板、电视等多终端的统一操作系统框架,也是 AI 能力被组织、分发与约束的核心层级。

这一判断,并非停留在概念层面。根据小米官方披露的数据,截至2024年底,小米 AIoT 平台已连接设备数超过8.2亿台,覆盖手机、平板、电视、穿戴与家居等多个品类。澎湃 OS 的目标,正是将这些分散设备纳入统一系统框架之中,使 AI 能力可以在不同终端间被调度与复用,而非依附于单一应用。

这意味着,在小米选择把 AI 能力牢牢放在操作系统内部,而且这个系统对应的硬件生态同样庞大。

另一边,作为小米 MiMo 大模型相关负责人,罗福莉在本次大会上首次公开亮相。在谈及 AI 能力演进方向时,她将重点放在任务理解与执行层面,强调 AI 需要具备对复杂需求进行拆解、规划并与系统能力协同完成的能力,而不仅停留在单轮问答或信息生成阶段。

从产业结构看,这条路线与字节所代表的 AI 云厂商路径形成了对照。

头部 AI 厂商希望进入手机 Agent 市场,逻辑并不复杂,是因为手机仍是用户最重要、最稳定的高频入口之一;但对手机厂商而言,操作系统、硬件整合与生态控制力,才是其长期优势所在。一旦 Agent 深度嵌入系统层,谁来定义交互方式、权限边界与默认入口,决定了最终的主导权。

这也是为什么,多数头部手机厂商在接入外部模型能力的同时,仍坚持自研 Agent 框架与系统级助手。它们更倾向于把云厂商视为能力提供者,而非产品定义者。

事实上,这并非一条新出现的路径。更早之前,华为在推进 HarmonyOS 与小艺助手的过程中,已经持续强化系统级调度与跨设备协同能力,并将 AI 能力作为操作系统的一部分加以演进。

根据华为在2024年开发者大会上的公开数据,HarmonyOS 生态已覆盖8亿+ 设备,注册开发者超过220万,并运行在手机、平板、穿戴、车机及各类 IoT 终端之上。在这一体系中,小艺并非独立应用,而是深度参与系统级调度与跨设备协同,用于统一调用多终端能力。

而在智能眼镜、耳机等新硬件形态上,这种生态差异被进一步放大。对屏幕受限、操作碎片化的设备而言,Agent 更接近“基础交互层”,而品牌与系统协同能力,往往比单一模型能力更重要。

在这一点上,显然传统硬件厂商的优势会更大,但AI厂商们,如字节和阿里也在推进各自的AI硬件业务,小艺与超级小爱,是否能够在端侧体验上全面超越豆包,目前仍难下定论。

但近期手机圈对于豆包和其他AI的“加码”已经清楚表明,无论是 AI 厂商还是手机厂商,都已将目光投向 AI 手机这一仍待开垦的系统级空间。

在豆包手机助手的“信号弹”作用下,2026年,AI手机有可能迎来“做大做强”的一年。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平