说实话，Kimi这次的东西挺难描述的

工作群里有真人，也有插科打诨的 AI。这并不罕见。

工作群里干活的全是AI，真人只需要作为甲方下达任务，一个包工头AI就会指挥一群各有所长的AI开始干活，检查进度，协调工作……

这不是科幻小说的设定，而是随着 K2.6发布，Kimi 开始内测的一个功能，Claw Group。

你可以建一个群，把自己的 AI 龙虾拉进来，再邀请朋友和他们的龙虾一起加入。

真人和 AI 在同一个群里聊天、协作、分工，互相@，像个团队一样。

这件事表面上看是个产品功能，但往深了想，它在测试一个更宏大的设想，当 AI 可以作为群成员存在，人类的协作方式会发生什么变化?

过去我们讨论 AI，默认的模式是一对一，一个人，一个 AI，或者是一对多，一个人，多个 AI。

Claw Group 打破了这个框架。AI 以"群成员"的身份出现，有自己的角色，有自己负责的任务，和真人并排坐在同一张桌子旁。

但一个有用的群成员，光会聊天是不够的。它得能干活，干得好，干得快，最好还能同时干好几件事。

这就回到了 Kimi 这次更新的另外两个方向。K2.6的 Vibe Coding 能力大幅提升，一段视频、一句提示词，就能生成一个前端审美达到设计师水准、而且有后端数据库能力的完整网站。Agent 集群则让单个 AI 进化成一支团队，最多可以调度300个分身并行推进，一次交付 PDF、Excel、PPT 等多种格式的材料。

三个能力放在一起，可以看到 Kimi 正在描述一个未来的场景。

K2.6一个模型就能看懂视频、写代码、部署上线，不只是做个好看的前端，前后端逻辑、数据库、用户系统，做一个真的能跑的项目。

Kimi Agent 集群则把单个 AI 的边界彻底打开，300个分身并行分工，像一支真正的团队一样处理普通模型根本跑不动的复杂任务。

而 Claw Group 提供的，是一种我们还没完全想清楚的未来，真人和 AI 坐进同一个群，各有角色，各司其职，这也许是人机协作真正形态的第一个雏形。

K2.6能用眼睛辅助编程

说一百次不如见一次。

你喜欢一个网页的设计，以前只能用文字描述:导航栏是什么风格、Hero 区的动效是怎么动的、字体大概是什么感觉，说半天 AI 还是猜。现在 K2.6支持直接上传图片/视频，录一段你想复刻的网页，它看得懂，直接照着还原出来。

我在网上找了一段赛博朋克风格的网页录屏，发给 K2.6，要求生成一个私募研究机构"赛博资本"的完整官网，带机构介绍、研报库、客户登录系统和路演预约功能。

上传完视频和要求后，K2.6把整个项目拆开、排好顺序、自己推进。拆解出了11个执行步骤，从分析参考视频、编写设计 PRD，到初始化项目、生成图片资源、构建 Canvas 粒子特效、搭建登录系统和预约功能，最后部署上线。

得益于 K2.6的多模态和工具调用能力，在思考过程中它不只是读文字，图片，还能调用工具生成图片、音频和视频。

生成的网页在风格上基本还原了参考视频的未来感，板块分布严格遵守了提示词的要求。

后端能力也有了，我尝试在网页上填写了一个表单，数据库那边立刻就有显示，不是静态页面，是真的可以跑的系统。

K2.6能用“眼睛”帮助编程，这么一来想象空间因此大了很多。

复刻网页只是最基础的用法。比如遇到一个交互 bug，以前要打一大段文字描述:哪个按钮、什么状态、触发了什么、期望结果是什么，写完描述比 bug 本身还复杂。现在录屏发过去，模型看到的就是你看到的，定位问题、给出修改，一步到位。

从"描述你想要什么"到"直接给它看"，这一步的距离，比想象中短得多。

Agent 集群 + Skill = 专业团队

网站建好了，是个空壳，需要真正的内容撑起来。

这一步我用的是 Kimi Agent 集群。任务是:以赛博资本研究团队的身份，产出一套完整的半导体行业研究材料，同时交付100页研究报告 PDF、底层数据 Excel、以及30页高管汇报 PPT。

在正式产出之前，先调用了几个内置 Skill，/equity-researcher 作为研究标准，/pdf、/xlsx、/docx 作为输出格式标准。如果不确定该用哪些技能，Kimi 还提供/kimi-skills-finder，帮你把需要的 Skill 找出来。

集群启动后的工作流程大致是，K2.6先分析拆解任务，生成一个总负责的专家 Agent 统领全局，再由它把工作拆分派发给各个子 Agent，每个子 Agent 是特定领域的专家。

本次半导体研究中，竺思 Agent 负责统领，佩吉 Agent 专攻 AI 芯片与高性能计算市场，林若因 Agent 研究存储芯片赛道。

进入每个 Agent 的具体任务可以发现，Kimi 并没有用同一套模板复制粘贴，而是给每个分身分配了完全不同的研究方向和职责。

竺思负责宏观市场，要解释为什么不同机构对2026年的预测差距能从9.5%拉到64%。林若因负责存储细分赛道，从 HBM 供需缺口到长鑫、长江存储的进展，每一条线都要单独跑透。

两个人坐在同一张研究桌旁，研究完全不同的问题，同时推进，互不等待。这才是集群的意义，不是一个 Agent 做完再交给下一个，而是真正的并行分工。

还有一个细节值得一提，当某个子任务研究失败时，Kimi Agent 会重新部署、重走一遍流程，而不是瞎编一个结果或者直接告诉你任务失败。研究完成后，再分配写作 Agent，有的负责图表制作，有的负责文字撰写，最后汇总交付。

格式整洁，表格、PDF、PPT 全部完整交付。Skill 在这里的作用不只是控制风格，也在约束整套材料的内在逻辑保持统一，PDF 里引用的数字和 Excel 原始数据对得上，PPT 摘要的结论和报告正文的逻辑链条也没有断裂。

Claw Group 未来的工作模式?

网站有了，研究材料有了，最后一个问题是:真人和 AI 能在同一个群里配合工作吗?

在 Kimi Claw 选项中建立并链接好龙虾，点击建立群聊，选择要入群的龙虾。群建好之后，可以邀请朋友的龙虾加入，也可以邀请真人直接进群。

龙虾群建立好后，也可以邀请你的朋友、同事的龙虾加入，当然，你的朋友真人也可以加入群。在群里龙虾和真人一起聊天，进行跨物种社交。

群里的分工大致是:真人负责下达需求，Kimi 负责指挥调度，龙虾负责执行具体任务。比如我在群里让龙虾分析一只股票，Kimi 接到指令后直接安排，龙虾开始跑数据，结果发回群里，真人在上面讨论。

我将第二步 Kimi Agent集群生产的文档发到群里，就能看到在Kimi的指挥下，两个龙虾在干活。

如果说一个龙虾只能控制一台电脑，那么一个龙虾群，理论上可以控制无限电脑，Harness的能力相对应提升。

这个框架一旦成立，可以延伸的场景就很多。

客户群里，真人负责和客户沟通，龙虾在后台实时整理对话要点、生成跟进清单。编辑群里，龙虾每天定时推送行业信号，编辑在群里直接拍板选题，甚至让龙虾起草初稿。投研群里，多个龙虾各自盯不同市场，真人只需要看汇总结论，有异常才介入。

过去的 AI 协作，是你去找 AI。Claw Group 翻转了这个逻辑，AI 就在群里，随时待命，真人什么时候需要什么时候用，不需要单独开一个对话窗口。

这也许还只是雏形。但"真人和 AI 坐进同一个群"这件事本身，已经在描述一种我们正在进入的工作方式。

写在最后

Kimi此次更新的三个重要功能测下来，有一个感受越来越清晰。

过去两年，AI 的进化方向主要是"更聪明"，推理更准、回答更长、错误更少。但 Kimi 这次更新描述的是另一个维度:更能协作。

一个模型能看懂视频、独立完成工程;一支集群能并行分工、交付专业团队才能完成的材料;一个群里真人和 AI 各有角色、各司其职。

这个转变还在早期。Claw Group 现在能做的事情还很有限，但方向已经很清楚了。

当 AI 有了越来越多的工具、技能和 Harness，下一个值得关注的问题不再是"AI 能不能做这件事"，而是"AI 会以什么形式嵌进人类的工作里"。

也许是一个随时待命的群成员，也许是一支并行推进的研究团队，也许是一个看完视频就开始写代码的工程师。形式还在演化，但有一件事已经确定，它不会只是一个等你发问的对话框了。

用哪个弄湿

少儿国寿福庆典版优缺点在哪？不足和亮点各参半

狗狗吃卫生巾怎么办

房贷二次扣款会影响征信吗？这是很有可能的

2020最新自助免费申请Office365教育版，免费5TOneDrive云盘详细图文教程

MacBook怎么绕过BootCamp安装Win10双系统

上海电信千兆宽带速度究竟如何上海电信千兆宽带

国内知名的前端博客

域名为什么会被墙如何检测域名是否被墙域名被墙如何处理

说实话，Kimi这次的东西挺难描述的

K2.6能用眼睛辅助编程

Agent 集群 + Skill = 专业团队

Claw Group 未来的工作模式?

写在最后

更多文章

站内搜索

标签云

热门文章

友情链接