手机厂靠拢豆包

努比亚 M153的三万台还没有卖光，豆包的手机端合作版图，有望进一步扩大。

近日，界面新闻报道称，字节跳动正推进与 vivo、联想、传音等硬件厂商开展 AI 手机合作，为其设备预装 AIGC 插件;多位 vivo 员工向媒体证实双方已确认合作、正在讨论细节。

不过，仅凭这条消息模糊的表述，尚无法确认这些“合作”的具体性质，是否和此前字节与中兴的合作方案划等号。此前，在 nubia M153上，字节在手机 OS 层深度构建了 GUI Agent，可以自动接管用户指定的跨 App 操作，但随后遭受了来自微信、淘宝等 App 的“反制”。

但从最新合作传闻中不难看出，M153的尝试还是吸引了手机行业的目光。随着字节带着豆包大模型能力入局，终端厂商的原生 AI 生态正在加速扩张。

这一趋势，在近日举办的火山引擎 FORCE 原动力大会上可以窥探一斑。

包括中兴、荣耀、小米、vivo 在内的多家手机厂商为火山引擎“站台”。不过，除 nubia 带来的 M153之外，大部分手机厂商和豆包的关系更多是模型能力的调用，Agent 层面的产品形态、交互方式以及系统级整合，依然主要由手机厂商主导。

在本届源动力大会的群访环节，火山引擎总裁谭待在接受直面 AI 采访时表示，“AI 的价值在于用更方便、更便利的方式，做大用户的需求”。

显然，不管后续字节和这些厂商的合作如何展开，一个行业趋势已经愈发清晰。系统层的 Agent 潜力巨大，即便当前落地存在一些阻力，但在 M153上已经能看到未来的雏形。

不管是合作还是自研，大模型厂商和手机厂商们，已经喊着“做大做强”的口号，加速涌入这一赛道。

手机厂商们加速拥抱字节等大模型厂商，背后是手机端原生助手领域，有着天然体量巨大的活跃用户基础。

QuestMobile 的2025年三季度报告显示，截至2025年9月，移动端 AI 应用 MAU 达到7.29亿;其中“手机厂商 AI 助手”规模约5.35亿，“原生 AI App”约2.87亿，“In-App AI”约7.06亿。

换言之，在原生 AI 的不同形态里，终端和 App 有着明显的用户“层级差”:原生 AI App 依赖用户主动点击触发，而系统级助手天然就在“随手就用”的前置位，甚至无需用户刻意点击就能维持日活。

事实上，围绕“如何在系统层唤起 AI、如何让助手不只停留在语音问答”的探索，几乎已经成为国内主流手机厂商的共识，只是受限于模型能力与工程稳定性，多数方案最终停留在“增强版语音助手”的阶段，而豆包手机助手的出现直接踢开了这扇大门。

尽管nubia M153呈现的效果在业内仍有争议，但豆包手机助手在 OS 层获得授权后，实现了自动接管用户的跨应用任务，让业内看到了完全体 GUI Agent 的雏形。这一形态带来的想象力空间，并不会随着部分超级 App 的“反制”而消失。

另一方面，随着近两年大模型在指令理解、多轮规划与工具调用能力上的明显跃迁，AI 首次具备了承担复杂任务链的可能;与此同时，移动端算力、内存与本地推理能力的持续提升，也让“端侧执行”不再只是概念。

手机端“可跑得动”的关键之一，是移动 SoC 的 NPU 峰值算力与能效在近两代出现跃升。根据行业调研机构 Counterpoint 的分析，2025年全球主流旗舰级 SoC 几乎全面支持生成式 AI，本年度出货的高端 SoC 中有约88% 已具备生成式 AI 能力，且这些芯片的 AI 算力峰值在2025年已经接近100TOPS级别，约为2021年水平的四倍。

AI登“机”的浪潮下，Siri 时代那种以固定指令为主的语音助手逻辑，已经难以满足用户对“智能”的期待。

在这样的窗口期下，手机厂商迫切需要在硬件与系统层面，寻找新的体验突破口;而 AI 云厂商，则拥有更成熟的模型与工程能力。双方的靠拢，并非一次偶然的商业试探，而是技术成熟度与产业需求叠加后的结果。

这也是为什么，尽管 M153的销量规模有限，但3万台工程机，仍像是一枚信号弹，给早已蠢蠢欲动的手机行业一个冲锋的信号。

这样的背景下，市场开始传出 vivo 等体量更大的厂商，与字节推进合作的消息，其实合情合理。这并不意味着所有厂商都会复制 M153的深度定制模式。vivo 此前就发布过“蓝心智能”AI 战略与自研蓝心大模型矩阵，并强调 OriginOS 与系统级智能体能力的升级。

另一边，以荣耀为例，YOYO Agent 已接入豆包大模型的部分能力，但 Agent 的训练、产品逻辑与系统整合，依然由荣耀主导完成。这种“能力接入而非产品外包”的方式，或许才是更多手机厂商在当前阶段的现实选择。

值得关注的是，荣耀首席影像工程师罗巍，此前曾就豆包手机助手发表个人观点:“因为字节没有硬件研发能力，或者硬件能力并不比中兴领先。那么就是两个矮子在一起，也不会生个高子。”

但在这番评价之后，荣耀的展台仍然作为火山引擎合作伙伴，出现在了本届原动力大会上。

回过头看，字节的这次激进，并不是脱离产业节奏的冒进，而是踩在一个已经逐渐成熟的窗口期上。M153的意义，也并不在于证明某一款产品的成功，而在于让行业更坚定地看到:端侧Agent，已经成为一条无法回避的路径。

而面对微信和淘宝等App不断筑高的城墙，App与Agent的关系，成了绕不开的下一问。

豆包手机助手面世以来，在业内迅速引发了一些讨论:当 AI 可以直接理解意图并代为操作，Agent 是传统 App 的威胁吗?

在本届火山引擎原动力大会的群访环节，谭待回应了直面AI提出的这一问题，他首先从用户视角进行了阐述。

“假如说用户想点一杯咖啡，点咖啡这个操作不管是通过跟机器人语音交互，还是操作手机完成，最后都是为了满足用户的需求。”在他看来，普通人还有很多需求没有被满足，通过 AI 可以更好地解决这些问题。

“至于这个 AI 的载体是 Web、App、agent，还是套了个 App 壳的 agent，可能没有那么大关系。”谭待这样说道。

所以，回到手机原生助手层面，能操作多少 App 也许从来不是问题的核心，真正重要的，是 AI 是否能用更低的使用成本，把原本未被满足的需求释放出来。当需求被“做大”，无疑在硬件层面可以建立起全新的用户心智，尤其是广大用户对 AI 已经并不陌生的2025年。

QuestMobile 数据显示，截至2025年第一季度，原生 AI 应用的月活跃用户规模大幅扩容，其中用户对 AI 原生应用从“尝鲜”逐渐转向“依赖”，其人均月使用次数同比增速明显高于使用时长增速。

报告显示，AI 原生应用的月人均使用次数同比增长约53.1%，而月人均使用时长则增长约32.7%，用户层面倾向于多次短时打开 AI 应用去完成即时类需求。

这些需求，正是手机原生 Agent 可以放大的那部分。但这本质上是一个增量逻辑，并不意味着 App 的价值短期内会被快速削弱。

中国信通院在2024年发布的数字应用生态报告指出，用户使用时长仍高度集中在少数头部 App 上，支付、即时通讯、短视频等核心应用合计占据超过八成的用户总使用时长。这些 App 所承载的账户体系、支付能力、内容供给与安全责任，短期内都不具备被 Agent 直接替代的条件。

也就是说，Agent 正在改变 App 的“入口位置”，而非消解其存在价值。

在这一结构中，App 仍然是能力与服务的封装体，但不再必然是用户表达需求的起点;Agent 则逐渐承担起“需求调度层”的角色，负责理解意图、拆解任务，并将执行分发给不同应用或系统能力。

甚至，用户驱动 Agent 的终端甚至未必是手机。

根据 Counterpoint Research 的追踪与分析数据，2025年智能可穿戴设备市场中 AI 智能眼镜等具备本地 AI 能力的终端表现出显著增长势头。2025年上半年，全球智能眼镜出货量同比增长超过110%，其中 AI 型智能眼镜的出货占比大幅提升，反映出业界对本地 AI 能力的快速采纳趋势。

而在这一背景下，字节也不会是唯一入场的大模型厂商。

智谱 AI 在近期将其核心 AI Agent 模型 AutoGLM 开源，使研究者与开发者能够基于该模型构建具备“Phone Use”能力的 AI 终端智能体。

AutoGLM 能够理解屏幕内容，并通过模拟用户操作（如点击、滑动、文字输入等）完成多步骤任务流程，目前已在微信、淘宝、抖音、美团等超过50个高频中文应用场景中展示出自动化操作的能力。

换言之，当更多大模型厂商试图“上机”，分水岭就不再只是模型接入，而是手机厂商是否愿意把系统层的 AI 入口与规则让渡出去。下一阶段的竞争，更像是“系统与生态”的较量。

如果说 nubia M153更像是一种“工程验证”，那么在它发布数周后，小米在人车家全生态大会上同步披露的澎湃 OS 与 AI 进展，则代表着传统手机豪强的同步跟进。

在这场大会上，小米并未将重心放在单一模型或功能上，而是反复强调澎湃 OS 作为系统级底座的角色——它正在成为连接手机、平板、电视等多终端的统一操作系统框架，也是 AI 能力被组织、分发与约束的核心层级。

这一判断，并非停留在概念层面。根据小米官方披露的数据，截至2024年底，小米 AIoT 平台已连接设备数超过8.2亿台，覆盖手机、平板、电视、穿戴与家居等多个品类。澎湃 OS 的目标，正是将这些分散设备纳入统一系统框架之中，使 AI 能力可以在不同终端间被调度与复用，而非依附于单一应用。

这意味着，在小米选择把 AI 能力牢牢放在操作系统内部，而且这个系统对应的硬件生态同样庞大。

另一边，作为小米 MiMo 大模型相关负责人，罗福莉在本次大会上首次公开亮相。在谈及 AI 能力演进方向时，她将重点放在任务理解与执行层面，强调 AI 需要具备对复杂需求进行拆解、规划并与系统能力协同完成的能力，而不仅停留在单轮问答或信息生成阶段。

从产业结构看，这条路线与字节所代表的 AI 云厂商路径形成了对照。

头部 AI 厂商希望进入手机 Agent 市场，逻辑并不复杂，是因为手机仍是用户最重要、最稳定的高频入口之一;但对手机厂商而言，操作系统、硬件整合与生态控制力，才是其长期优势所在。一旦 Agent 深度嵌入系统层，谁来定义交互方式、权限边界与默认入口，决定了最终的主导权。

这也是为什么，多数头部手机厂商在接入外部模型能力的同时，仍坚持自研 Agent 框架与系统级助手。它们更倾向于把云厂商视为能力提供者，而非产品定义者。

事实上，这并非一条新出现的路径。更早之前，华为在推进 HarmonyOS 与小艺助手的过程中，已经持续强化系统级调度与跨设备协同能力，并将 AI 能力作为操作系统的一部分加以演进。

根据华为在2024年开发者大会上的公开数据，HarmonyOS 生态已覆盖8亿+ 设备，注册开发者超过220万，并运行在手机、平板、穿戴、车机及各类 IoT 终端之上。在这一体系中，小艺并非独立应用，而是深度参与系统级调度与跨设备协同，用于统一调用多终端能力。

而在智能眼镜、耳机等新硬件形态上，这种生态差异被进一步放大。对屏幕受限、操作碎片化的设备而言，Agent 更接近“基础交互层”，而品牌与系统协同能力，往往比单一模型能力更重要。

在这一点上，显然传统硬件厂商的优势会更大，但AI厂商们，如字节和阿里也在推进各自的AI硬件业务，小艺与超级小爱，是否能够在端侧体验上全面超越豆包，目前仍难下定论。

但近期手机圈对于豆包和其他AI的“加码”已经清楚表明，无论是 AI 厂商还是手机厂商，都已将目光投向 AI 手机这一仍待开垦的系统级空间。

在豆包手机助手的“信号弹”作用下，2026年，AI手机有可能迎来“做大做强”的一年。

Published by

风君子

近期文章

标签

书签