说实话,Kimi这次的东西挺难描述的

工作群里有真人,也有插科打诨的 AI。这并不罕见。

工作群里干活的全是AI,真人只需要作为甲方下达任务,一个包工头AI就会指挥一群各有所长的AI开始干活,检查进度,协调工作……

这不是科幻小说的设定,而是随着 K2.6发布,Kimi 开始内测的一个功能,Claw Group

你可以建一个群,把自己的 AI 龙虾拉进来,再邀请朋友和他们的龙虾一起加入。

真人和 AI 在同一个群里聊天、协作、分工,互相@,像个团队一样。

这件事表面上看是个产品功能,但往深了想,它在测试一个更宏大的设想,当 AI 可以作为群成员存在,人类的协作方式会发生什么变化?

过去我们讨论 AI,默认的模式是一对一,一个人,一个 AI,或者是一对多,一个人,多个 AI。

Claw Group 打破了这个框架。AI 以"群成员"的身份出现,有自己的角色,有自己负责的任务,和真人并排坐在同一张桌子旁。

但一个有用的群成员,光会聊天是不够的。它得能干活,干得好,干得快,最好还能同时干好几件事。

这就回到了 Kimi 这次更新的另外两个方向。K2.6的 Vibe Coding 能力大幅提升,一段视频、一句提示词,就能生成一个前端审美达到设计师水准、而且有后端数据库能力的完整网站。Agent 集群则让单个 AI 进化成一支团队,最多可以调度300个分身并行推进,一次交付 PDF、Excel、PPT 等多种格式的材料。

三个能力放在一起,可以看到 Kimi 正在描述一个未来的场景。

K2.6一个模型就能看懂视频、写代码、部署上线,不只是做个好看的前端,前后端逻辑、数据库、用户系统,做一个真的能跑的项目。

Kimi Agent 集群则把单个 AI 的边界彻底打开,300个分身并行分工,像一支真正的团队一样处理普通模型根本跑不动的复杂任务。

而 Claw Group 提供的,是一种我们还没完全想清楚的未来,真人和 AI 坐进同一个群,各有角色,各司其职,这也许是人机协作真正形态的第一个雏形。

K2.6能用眼睛辅助编程

说一百次不如见一次。

你喜欢一个网页的设计,以前只能用文字描述:导航栏是什么风格、Hero 区的动效是怎么动的、字体大概是什么感觉,说半天 AI 还是猜。现在 K2.6支持直接上传图片/视频,录一段你想复刻的网页,它看得懂,直接照着还原出来。

我在网上找了一段赛博朋克风格的网页录屏,发给 K2.6,要求生成一个私募研究机构"赛博资本"的完整官网,带机构介绍、研报库、客户登录系统和路演预约功能。

上传完视频和要求后,K2.6把整个项目拆开、排好顺序、自己推进。拆解出了11个执行步骤,从分析参考视频、编写设计 PRD,到初始化项目、生成图片资源、构建 Canvas 粒子特效、搭建登录系统和预约功能,最后部署上线。

得益于 K2.6的多模态和工具调用能力,在思考过程中它不只是读文字,图片,还能调用工具生成图片、音频和视频。

生成的网页在风格上基本还原了参考视频的未来感,板块分布严格遵守了提示词的要求。

后端能力也有了,我尝试在网页上填写了一个表单,数据库那边立刻就有显示,不是静态页面,是真的可以跑的系统。

K2.6能用“眼睛”帮助编程,这么一来想象空间因此大了很多。

复刻网页只是最基础的用法。比如遇到一个交互 bug,以前要打一大段文字描述:哪个按钮、什么状态、触发了什么、期望结果是什么,写完描述比 bug 本身还复杂。现在录屏发过去,模型看到的就是你看到的,定位问题、给出修改,一步到位。

从"描述你想要什么"到"直接给它看",这一步的距离,比想象中短得多。

Agent 集群 + Skill = 专业团队

网站建好了,是个空壳,需要真正的内容撑起来。

这一步我用的是 Kimi Agent 集群。任务是:以赛博资本研究团队的身份,产出一套完整的半导体行业研究材料,同时交付100页研究报告 PDF、底层数据 Excel、以及30页高管汇报 PPT。

在正式产出之前,先调用了几个内置 Skill,/equity-researcher 作为研究标准,/pdf、/xlsx、/docx 作为输出格式标准。如果不确定该用哪些技能,Kimi 还提供/kimi-skills-finder,帮你把需要的 Skill 找出来。

集群启动后的工作流程大致是,K2.6先分析拆解任务,生成一个总负责的专家 Agent 统领全局,再由它把工作拆分派发给各个子 Agent,每个子 Agent 是特定领域的专家。

本次半导体研究中,竺思 Agent 负责统领,佩吉 Agent 专攻 AI 芯片与高性能计算市场,林若因 Agent 研究存储芯片赛道。

进入每个 Agent 的具体任务可以发现,Kimi 并没有用同一套模板复制粘贴,而是给每个分身分配了完全不同的研究方向和职责。

竺思负责宏观市场,要解释为什么不同机构对2026年的预测差距能从9.5%拉到64%。林若因负责存储细分赛道,从 HBM 供需缺口到长鑫、长江存储的进展,每一条线都要单独跑透。

两个人坐在同一张研究桌旁,研究完全不同的问题,同时推进,互不等待。这才是集群的意义,不是一个 Agent 做完再交给下一个,而是真正的并行分工。

还有一个细节值得一提,当某个子任务研究失败时,Kimi Agent 会重新部署、重走一遍流程,而不是瞎编一个结果或者直接告诉你任务失败。研究完成后,再分配写作 Agent,有的负责图表制作,有的负责文字撰写,最后汇总交付。

格式整洁,表格、PDF、PPT 全部完整交付。Skill 在这里的作用不只是控制风格,也在约束整套材料的内在逻辑保持统一,PDF 里引用的数字和 Excel 原始数据对得上,PPT 摘要的结论和报告正文的逻辑链条也没有断裂。

Claw Group 未来的工作模式?

网站有了,研究材料有了,最后一个问题是:真人和 AI 能在同一个群里配合工作吗?

在 Kimi Claw 选项中建立并链接好龙虾,点击建立群聊,选择要入群的龙虾。群建好之后,可以邀请朋友的龙虾加入,也可以邀请真人直接进群。

龙虾群建立好后,也可以邀请你的朋友、同事的龙虾加入,当然,你的朋友真人也可以加入群。在群里龙虾和真人一起聊天,进行跨物种社交。

群里的分工大致是:真人负责下达需求,Kimi 负责指挥调度,龙虾负责执行具体任务。比如我在群里让龙虾分析一只股票,Kimi 接到指令后直接安排,龙虾开始跑数据,结果发回群里,真人在上面讨论。

我将第二步 Kimi Agent集群生产的文档发到群里,就能看到在Kimi的指挥下,两个龙虾在干活。

如果说一个龙虾只能控制一台电脑,那么一个龙虾群,理论上可以控制无限电脑,Harness的能力相对应提升。

这个框架一旦成立,可以延伸的场景就很多。

客户群里,真人负责和客户沟通,龙虾在后台实时整理对话要点、生成跟进清单。编辑群里,龙虾每天定时推送行业信号,编辑在群里直接拍板选题,甚至让龙虾起草初稿。投研群里,多个龙虾各自盯不同市场,真人只需要看汇总结论,有异常才介入。

过去的 AI 协作,是你去找 AI。Claw Group 翻转了这个逻辑,AI 就在群里,随时待命,真人什么时候需要什么时候用,不需要单独开一个对话窗口。

这也许还只是雏形。但"真人和 AI 坐进同一个群"这件事本身,已经在描述一种我们正在进入的工作方式。

写在最后

Kimi此次更新的三个重要功能测下来,有一个感受越来越清晰。

过去两年,AI 的进化方向主要是"更聪明",推理更准、回答更长、错误更少。但 Kimi 这次更新描述的是另一个维度:更能协作。

一个模型能看懂视频、独立完成工程;一支集群能并行分工、交付专业团队才能完成的材料;一个群里真人和 AI 各有角色、各司其职。

这个转变还在早期。Claw Group 现在能做的事情还很有限,但方向已经很清楚了。

当 AI 有了越来越多的工具、技能和 Harness,下一个值得关注的问题不再是"AI 能不能做这件事",而是"AI 会以什么形式嵌进人类的工作里"。

也许是一个随时待命的群成员,也许是一支并行推进的研究团队,也许是一个看完视频就开始写代码的工程师。形式还在演化,但有一件事已经确定,它不会只是一个等你发问的对话框了。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平