桌面,正成为2026年AI(人工智能)巨头竞逐的新战场。
最新导火索来自海外。人工智能公司Anthropic推出的一款AI产品Claude Cowork,重新定义了AI助理的潜力,迅速点燃全球市场对“桌面Agent”(桌面智能体)的期待。
这股热潮迅速触发国内市场的连锁反应。就在Claude Cowork引发广泛讨论之际,中国主要AI玩家的类似布局也相继浮出水面。
1月30日,有消息称,阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,仅靠输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。针对这一消息,《每日经济新闻》记者(以下简称每经记者)向阿里方面进行了求证,暂未收到回应。
而在更早之前,MiniMax已经上线了一款桌面Agent。2月3日,MiniMax Agent产品负责人寻鹭对每经记者表示,通过接管本地环境,该Agent不仅能操作本地文件和软件,还能积累长期记忆。
若将时间线再向前推移,同为“AI六小龙”之一的阶跃星辰早在2025年9月就已发布“阶跃AI桌面伙伴”,主打本地化任务执行,尝试更主动地提供服务。
从2025年下半年的悄然试水,到2026年初的集中呈现,国内头部企业的动作或反映出,“桌面Agent”已成为AI技术最具象、也最迫切的落地场景之一。
不过,能力的飞跃往往伴随着风险的升级。当AI被赋予直接访问、操作甚至修改本地文件系统和应用程序的更高权限时,数据隐私、系统安全等问题又该如何解决?

图片来源:每经媒资库
Cowork点燃战火,阿里、MiniMax、阶跃星辰都已入场
2026年开年至今,AI对各行各业的冲击还在加剧。
2026年1月,Anthropic(美国人工智能股份有限公司)发布了AI产品Claude Cowork,可一键整理桌面,并基于用户上传的文件和指令完成创建文档、制定计划、分析数据等任务。这一产品一上线,便对传统办公软件与自动化工具的市场格局形成冲击。
近日有消息称,受Anthropic推出的新型自动化工具影响,当地时间2月3日,市场对软件股产生恐慌性抛售情绪。
据证券时报报道,摩根士丹利追踪的一篮子软件服务(SaaS)股票,在2025年下跌11%之后近期仍持续走弱。
同样在1月,一个有着“龙虾”图标的开源项目OpenClaw(原 Clawdbot/Moltbot)迅速走红。
就Claude Cowork和OpenClaw二者之间的关系,豆包称,OpenClaw是第三方开源项目,可调用Claude API(应用编程接口)作为“大脑”提供推理与记忆能力,Anthropic未参与其开发,仅提供模型服务并收取API费用。
北京市社会科学院副研究员王鹏对每经记者表示,Cowork和OpenClaw代表了桌面Agent的两种演进路径。
在他看来,Claude Cowork侧重于协同办公与任务规划,更像是一个集成在系统底座的“数字员工”,强调对工作流的理解和跨应用的逻辑编排。
“OpenClaw侧重于底层操控与自我进化。其前身为Moltbot,具备更强的本地环境接管能力、持久化记忆以及自主学习操作新软件的能力,更强调从‘大脑’向‘手脚’的全面演进。”王鹏说。
快思慢想研究院院长、特邀评论员田丰对每经记者表示,Cowork采用文件夹级权限限制,更适合企业级标准化部署;OpenClaw开放系统级权限,支持终端命令执行,适合开发者定制但依赖用户自身安全意识。
二者虽有区别,但都被归类为独立的桌面AI Agent产品。值得一提的是,据记者了解,国内AI公司对此早有布局。
1月19日,阶跃星辰正式官宣:全新升级电脑端Agent产品“阶跃AI桌面伙伴”,并推出Windows(微软公司研发的操作系统系列)版本,可以免费使用。另据报道,早在2025年9月,该AI助手就已经上线,当时仅有Mac(苹果计算机)版本,但能在电脑本地及云端双侧为用户执行复杂任务。
此外,1月20日,MiniMax发布Agent2.0版本,定位“AI原生工作台”,不仅上线了桌面端,支持Mac和Windows,还推出了面向专业垂直场景的“专家Agents”。
寻鹭对每经记者表示,MiniMax在2025年初期启动了Agent框架的自研工作,并持续通过“Agent实习生”项目验证真实工作场景的需求和价值,到目前,大家可以看到一个能像人类助理或实习生一样嵌入工作流、处理长链路复杂任务并真正交付可用结果的AI原生工作台。
“MiniMax Agent从研发上线到不断迭代的每一步,本质上是希望AI从单纯的‘对话者’进化为真正能干活的‘行动者’。”寻鹭说。

图片来源:每经媒资库
实测国产AI桌面Agent:从“对话”到“执行”
当下,国产AI桌面Agent的实际落地与应用效果究竟如何?与豆包和千问等AI助手的区别又是什么?
每经记者发现,当前,MiniMax旗下的桌面AI Agent已经可以直接下载、安装并登陆,QoderWork也可以直接下载,登陆则需用户在官网首页“申请加入邀测”,至于“阶跃AI桌面伙伴”,则需要用户在下载后扫码加群获取内测码。
就实际体验而言,每经记者通过苹果电脑实测发现,MiniMax旗下的桌面AI Agent的图标会出现在底部任务栏,自称可以完成聊天、作答、编程、代码分析和文档处理等各项任务。
在授予了其相关权限后,每经记者要求其整理电脑上的Word文档并将这些文档全部挪入指定的文件夹。经过数秒的思考,该Agent很快就完成了这一任务,并计算出了Word文件的数量。

MiniMax桌面Agent页面
寻鹭对每经记者表示,之所以推出桌面端,是为了解决网页端无法充分覆盖的核心痛点。比如,网页端受限于沙盒(在计算机安全领域是一种为运行中的程序提供隔离环境的安全机制)环境,难以处理本地超大文件或海量素材,且在进行浏览器自动化操作时极易被风控拦截,无法像真人一样顺畅地管理社媒或采集信息。
“为了突破这些限制,我们在MiniMax Agent中上线桌面原生能力。通过接管本地环境,Agent不仅能操作本地文件和软件,还能积累长期记忆。”寻鹭说。
与MiniMax桌面Agent相比,阶跃AI桌面伙伴的图标默认显示在屏幕右侧,且支持自由拖动。
此外,阶跃AI桌面伙伴会推荐自身类似生活助理的功能,比如喝水提醒和久坐提醒等。
当每经记者询问其与豆包的区别时,阶跃AI桌面伙伴表示,其专注于电脑桌面助手,可以直接操作用户的文件、日程、执行代码等,而豆包的产品形态更多样化。
就这类桌面Agent与豆包、千问等AI助手的区别,田丰表示,传统助手依赖云端推理与有限工具调用(如搜索、日历),系统级权限极少;而桌面Agent加大权限放权,直接接管本地系统权限(文件读写、应用操作)。例如阶跃AI桌面伙伴可直接修改Excel格式,而豆包仅能生成文本建议。
艾媒咨询CEO张毅在接受每经记者采访时表示,桌面Agent依托本土执行、系统级操作与长期记忆能力,展现出更强的自主规划能力,能够直接调动本地应用处理文件,实现任务全流程闭环;豆包和千问这类AI助手主要以云端对话为主,更多是给答案,而不是动手去做。
不过,Agent本就是AI助手的核心发展方向。张毅认为,AI助手必然会从对话工具升级为包括桌面端的操作,这是由用户端的需求决定的。张毅预测,AI助手将更深度地融入生态与本地应用,形成“云端大脑+本地手脚”的组合,这或将成为一个明确的发展方向。
豆包也在回答记者提问时表示,从技术趋势和产品方向来看,未来其完全有可能具备桌面Agent的能力,但会以更安全、更智能、更贴合用户体验的方式实现。

图片来源:每经媒资库
如何在“赋能”与“失控”间找到安全边界?
桌面Agent为何会在近期突然爆火?
对此,王鹏认为,2025年底至2026年初,模型在复杂逻辑推理和计算机操作(Computer Use)能力上达到量变到质变的临界点,使得“操作电脑”不再频繁卡顿。
“传统网页版AI无法解决‘文件搬运’和‘跨软件操作’的最后一百米,桌面端的便捷性直接击中了办公刚需。”王鹏说。
田丰认为,“Clawdbot开源时刻”(OpenClaw前身)起到了催化效应。
“OpenClaw因开源免费,所以全球示范效应十分显著,其用例(如比价、邮件处理)验证了Agent替代重复性工作、长程任务的可行性,引发社交媒体传播。另一方面,OpenClaw硬件适配成本下降,普通人也能在本地或云端玩起Agent。”田丰说。
虽说突破客观存在,但桌面Agent的风险也引发部分业内人士的担忧。
张毅表示,桌面Agent在执行任务时,可能出现权限滥用、隐私泄露等问题,由此引发的合规争议几乎不可避免。
具体来说,田丰提到,开源OpenClaw若未设置操作确认机制,可能误删系统文件、保密商业邮件、高价值研究文档。业界采用Docker容器、虚拟机隔离应对,但会牺牲性能、功能自由度。
寻鹭表示,MiniMax Agent桌面端的核心价值在于让AI从“只能说”变成“能动手做”,包括在本地进行文件操作和命令执行、自动化操作网页并完成信息采集等任务,以及集成截图、通知、快捷键等原生能力。难点包括跨平台兼容(需要同时适配macOS和Windows两套系统环境),进程管理需要处理长时间运行任务的超时控制,以及在保证安全的前提下,将系统能力开放给AI调用。
他透露,在安全与隐私方面,MiniMax采取了严格的隔离策略,云端仅负责思考不存储本地文件,同时借鉴IDE(集成开发环境)的权限管理机制,对所有涉及新工作区或高风险命令的操作实施“权限边界控制”,必须经由用户确认。
“此外,我们还引入了智能风控逻辑,利用大模型优先选择‘移动到回收站’等可逆操作,最大限度地保障用户的数据安全。”寻鹭说。
张毅认为,应对相关风险应采用更小权限与动态授权机制,对行为过程进行审计把关;同时建议本地数据尽量不出端,这一点至关重要。此外,未来各厂商需特别注重功能与安全之间的平衡。
“欧盟AI法案要求高风险系统具备‘人类监督’条款,桌面Agent需内置中断机制。即每一个Agent背后都应有一个人类‘法人’,对Agent所有操作负责到底。”田丰说。
值得一提的是,桌面Agent当前的商业模式相对AI助手更为清晰。
每经记者在QoderWork官方看到,其罗列出了适用于个人和团队的明确收费标准。此外,记者也从MiniMax方面了解到,其桌面Agent目前是会员订阅制,做专业任务会消耗积分。

QoderWork价格页面
从海外到国内,从“对话式”到“执行式”,AI正以前所未有的深度侵入我们的工作流核心。2026年的开年喧嚣或许只是一个开始,桌面Agent的最终形态,将是技术能力、用户体验、安全信任与商业逻辑的复杂平衡。
当AI真正开始“接管桌面”,它要征服的不仅是代码和系统,更是用户心底那道关于控制与托付的终极关卡。
声明:包含AI生成内容
