字节跳动豆包团队在AI(人工智能)大模型与手机终端的融合赛道上投下一枚“深水炸弹”。
12月1日,豆包手机助手技术预览版发布。据介绍,豆包手机助手是在豆包App的基础上,基于豆包大模型的能力和手机厂商的授权,和手机厂商在操作系统层面合作的AI助手软件。
与外界一度猜测的“豆包自研手机”不同,这款以系统级合作为基础的AI助手,选择了以“生态共建”的方式,将大模型能力渗透进硬件终端。目前,豆包手机助手可在豆包与中兴合作的工程样机nubia M153上体验。豆包方面表示,这是一款需要和手机厂商一起完成的产品,目前正与多家手机厂商洽谈助手合作,没有自行开发手机的计划,后续将公布更多进展。
从昔日收购VR(虚拟现实技术)厂商PICO,到去年推出AI耳机Ola Friend,再到如今聚焦于软件赋能硬件,字节在硬件领域的布局历经多次迭代。此次手机助手的发布,进一步折射出其在争夺AI入口上的路径选择。
在手机赛道竞争白热化的当下,字节此番“以退为进”,正指向一个更深层的问题:AI时代的终端入口,究竟会以何种形态到来?
豆包捅开AI手机“窗户纸”
豆包手机助手的发布,本质上是字节大模型技术在移动终端的一次系统性落地。
依托豆包大模型在推理、视觉理解、语音交互、图形界面操作等能力,豆包手机助手能够打破传统AI助手的功能边界,具备“像人类一样操作手机”的能力。
目前,豆包与中兴合作的工程样机nubia M153已在中兴商城少量发售。中兴商城页面显示,该机搭载高通骁龙8至尊版移动平台,16GB+512GB版本的售价为3499元。

图片来源:中兴商城截图
豆包成为“手机助手”,究竟能够带来怎样的赋能?在与中兴nubia M153工程样机的合作演示中,豆包的能力被具体化为两个层面。
一是“所见即可问”的实时交互。用户可通过语音、侧边键或豆包Ola Friend耳机直接唤醒豆包,在任何界面都能就屏幕内容直接提问。同时,豆包手机助手也将语音通话、视频通话和屏幕共享等用户常用功能嵌入助手中,用户双击侧边AI键即可调用。
二是“所言即可为”的跨应用自动化。据官方介绍,该功能可根据用户指令在多款应用间自动跳转,帮助用户完成类似查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务。
在演示视频中,对于社交媒体上的商品,豆包也可以进行识别,此时若再说出“帮我在全平台比价下单”,豆包手机助手即可在多个电商平台搜索同款商品,对比价格和规格,自动领券后选择最低价的商品下单。不过,涉及支付等高敏感环节时,助手会提示用户手动完成。
此外,豆包手机助手推出的记忆功能可根据用户需求存储个人偏好信息,在Pro模式下还能结合系统工具调用与强化推理能力,实现更精准的服务。例如用户提出“为女儿选礼物”的需求时,助手会基于已存储的孩子年龄、兴趣等数据生成推荐方案,无需重复输入信息,而所有记忆功能均需用户主动开启。

豆包手机助手演示视频截图 图片来源:豆包公众号
在大模型竞争进入落地决胜阶段的背景下,手机作为用户日均使用时长最长的终端,是AI技术触达用户的核心场景。对字节而言,推动豆包手机助手深入手机腹地,其战略意义远大于功能本身。
至于为何最终选择合作打造智能终端的生态而不是亲自下场造手机,在知名经济学者、工信部信息通信经济专家委员会委员盘和林看来,其关键在于在当下手机“红海”中并无做硬件终端的必要。
盘和林在接受《每日经济新闻》记者微信采访时表示:“造手机不难,难的是手机行业如今‘卷’成红海,利润率很薄,这个时候直接下场做硬件终端毫无必要,因为要撬动如今的手机市场格局,必须打价格战。所以,字节选择了手机行业的‘边缘品牌’作为切入口,来推进自己的助手,这是成本最低的做法。”但他同时也指出,至于是否能够成为超级入口尚属未知,因为大部分人还没有用过,“对于一个工具而言,好不好用是检验市场潜力的唯一标准”。
对于这一测试产品,豆包手机助手也在官方视频结尾处提示,尽管演示内容均为真实录制,但受限于大模型技术的不确定性,相关场景无法保证百分百复现。当前产品实际可用性与团队预期仍有差距,未来仍将持续迭代优化。
字节的AI硬件征程
字节跳动对下一代硬件入口的敏锐嗅觉,早已有迹可循。
从收购PICO高调进军VR,到推出AI耳机Ola Friend探索近场交互,其硬件战略的每一步迭代,都折射出对技术浪潮的紧密跟随。虽然VR赛道尚未迎来预期中的爆发,但从字节对PICO的收购中,无疑可以看到其在硬件领域不甘旁观的态度。
去年10月,从字节跳动豆包发布的AI智能体耳机Ola Friend来看,字节对硬件的思考已经转向了赋能与增强现有的终端体验。
Ola Friend是一款开放式耳机,它接入了豆包大模型并与豆包App紧密融合。用户戴上耳机后无需打开手机,只需说出“豆包豆包”便能唤起对话,获得信息查询、旅游出行、英语学习及情感交流等场景下的服务。
此外,字节推出的AI陪伴玩偶“显眼包”在二手平台溢价转手。智能玩具、可穿戴设备等小体量硬件产品通过搭载豆包大模型能力,也正以更便捷和多元的形式触达用户。
与此同时,字节跳动云服务平台“火山引擎”也正在与各类智能终端厂商合作,将语音识别、视觉算法等AI能力以解决方案的形式输出给汽车、家电、消费电子等领域的合作伙伴。这种技术赋能的B端模式,为如今豆包手机助手以“生态合作”形式切入C端市场,积累了经验、基础与技术接口。
对于字节的系列布局与最新选择,盘和林指出,其核心目的在于“嵌入硬件,扩大字节和用户的接触面,实现AI软件的触达,从而逐步做大豆包生态”。他进一步阐释,豆包生态当前的优势主要在于内容创作,但在手机等终端上尚未掌握话语权。“所以,字节会不断和在AI上存在短板的手机厂商合作。”盘和林表示。
眼下,字节跳动以豆包手机助手叩开AI手机的大门,“轻装上阵”嵌入现有的硬件生态。但从目前来看,演示场景能否完全复现、用户体验与隐私保护将如何保持平衡等,仍是AI手机助手绕不开的难题。并且,手机厂商们也在持续打磨AI能力,自身对核心入口的掌控意志依然强烈。
豆包手机助手捅破AI手机“窗户纸”,背后不仅是硬件形态之战,更是智能服务渗透广度和深度的较量。这条路能否走通,不仅将决定字节在AI时代的生态位,还可能重新定义用户与智能世界交互的方式。
