前天晚上,我的微信账号,终于拿到了微信小微的内测资格。

无论怎么说,微信这种十几亿日活国民级别的产品,全面拥抱AI,我觉得在整个互联网行业,都是一个巨大的信号,也是值得大家研究的案例。
在深度玩了一天以后,我想说,微信Agent在跟微信原生能力的打通上,有很多超出我预期的部分,但是在智能程度上,也有蛮多不及我预期的部分。
但是我依然愿意称,这是微信有史以来最大的更新。
还是先聊聊功能上。
当你获得小微的体验资格以后,它就会常驻在你的左上角了,替代了原来的星标区域。

点开以后,其实就是一个大家每天都会见到的对话框。
默认进来是语音输入,点击一下才会变成文本输入框,然后支持上传照片、吊起摄像头拍照、以及上传文件。

在这个对话框里,你可以直接调用大模型来跟微信的很多原生能力进行交互。
小微背后的基座模型,应该是两个,一个是主模型WeLM,这是微信自己做的,另一部分偶尔会借助DeepSeek模型来进行回复。
WeLM目前没有太多的数据,只能通过官方年初发布的部分信息看出端倪。

之前透露出了两个模型型号,一个是WeLM-V4-80B的MoE,激活参数量是3B,一个是第三代的,WeLM-V3-258B,激活22B的MoE。
坦率的讲,微信的算力压力还是巨大的,因为我觉得微信很难在这块进行收费和商业化,他们大概率自己也还没有想清楚,现在内测人数不多,他们还是能扛得住的,但是如果真的哪天全量了,那可是14亿的用户,这个数量级的用户的推理需求,我感觉国内哪家公司都可能都抗不住。
这就是AI时代和互联网时代最大的不同,互联网时代用户的边际成本几乎为0,但是AI时代,那不好意思,每一个用户,那真的背后都是白花花的钱。
这也是我为啥看好端侧算力的原因,因为只有这样,才能让所有用户,享受到真正的AI普惠。
从我的测试直觉上,这次的WeLM有可能就是这个80B激活3B的小模型系列来进行服务的,所以从这个参数上来说,你就不能指望它能完成多么复杂的任务。
这个对话框中,目前支持蛮多的功能。
比如一个很多很多人都觉得没啥蛋用的功能,让Agent给人发消息、发红包、打电话之类的。

我的小微回复的口吻稍微会有点特殊,不是正常回复,是因为我想看到小微背后的工具链具体是咋实现的,学习一下做法,所以强行让他扭了过来,让它每一步都要吐一些工具调用,这个其实是不正常的,大家跟小微对话的时候,它回复的还是正常的预期,就像第一张图一样。
小微有一个其实不是很Agent的点,就是几乎每一步都需要你确认,确认是否要拨打语音电话,确认是否要发消息,确认是否真的给这人转账。
这个我们也能理解,因为通讯录以及人与人之间的交互这个事,实在是太敏感了,不谈隐私问题,有无数的灰产这么多年一直跟微信斗智斗勇,你这个东西如果不进行确认,那基本就炸了,最开心的,就是那群灰产了。
这个思路,也几乎贯穿这小微这个Agent所有的设计中。
比如大家最最想要的方便你我他的,比如批量给人发送消息、定时给人发送消息等等,都不可以。

整个微信通讯录其实被封装成了一个skill,我把skill文档给扒了下来,其实就可以看出来一些端倪了。

比如这一连串的禁止事项。
其实微信在通讯录和消息这块的处理,从这个skill我都能感受到,压力也挺大的。
所以开放的能力都非常谨慎,目前基于通讯录开放的能力中,就是给个人/群聊发消息,给个人发起视频通话,给个人发红包或者转账这几个场景比较好,但是同时,就跟很多人说的一样,不够便捷,反而鸡肋。
因为本质上用户的交互成本差不多。
比如我要给鲜虾包打电话。
Agent交互流程是:点击小微 – 输入“我要给鲜虾包打电话” – 等待 – 确认。
常规GUI流程是:点击搜索框 – 输入鲜虾包 – 点击头像 – 点击菜单 – 点击语音通话。
其实只是把点击成本转化为了输入成本,在便利性上,并没有方便特别多。
基于通讯录这块,比较期待微信后续对Agent能力的开放了,比如是不是可以批量或者定时发消息之类的,这些我觉得就能真正的体现出Agent的价值了。
当然,也不是说完全就没有用了,因为如果你只做这一件事,那确实是意义不是很大,但是如果是个稍微复杂一点点的长程任务,这就会方便非常多了。
比如说,我明天要找鲜虾包中午吃饭,那我可以直接给自己设置一个明天中午吃饭的日程提醒,同时也要把这个消息直接发给鲜虾包。

这种就简单很多了。
Agent真正的价值,我还是觉得在未来的长程复杂任务上,能帮我们更便捷的省心省力。
在这个主入口中,还有一些其他的能力,比如打通了朋友圈,你可以问,今天最装逼的朋友是谁。。。

不过其实朋友圈本质是先筛选,并且限制了最多只能拿到最近2天的时间,所以,你想总结过去所有的朋友圈之类的操作,其实就不是特别现实了。

不过最后挑出来的朋友圈,右边那个小按钮,是可以直接点开浮起一个弹窗,支持跳转到朋友圈原文的,这个好评的。
除了朋友圈,也支持公众号和视频号的查询和搜索。

也支持创建提醒,处理文件,创建笔记,这种就是常规操作了。

不过我本来还挺期待,Agent可以跟我的微信收藏打通,但是这个权限并没有开放,小微只能操作他自己创建的笔记。

还有个好玩的事,就是也跟微信支付打通了,可以进行一些好玩的查询操作,比如说,我可以授权以后,来查我今年发了多少红包出去。

不过整体所有你跟小微的交互,都有一个比较核心的特点,我总结成了4个字:
只读不动。
微信目前已经在尽可能的给小微开权限了,但是还是人口基数过于庞大,你不能保证每一个人都是能熟练操作手机的,更别提是能熟练使用Agent了,如果操作权限也给了一部分,你很难说,会发生什么样的舆情。
所以像一些帮我删掉加了超过一年但从来没有说过话的好友、比如取消关注我3个月以上没有打开的公众号等等,全都无法操作。
因为这是微信,所以这个谨慎的态度,是可以理解的。
而在小程序操作上,目前支持很多小程序,这块我也直接列一个我扒拉出来的官方skill的边界吧。
##触发条件用户明确说"打开/用/通过…(某小程序名)做X"本地生活类下单/预约:外卖、奶茶咖啡、扫码点餐、堂食排队、KTV、洗车、家政出行类:打车(滴滴等)、共享单车、查公交地铁、查驾车路线/耗时、查火车票机票、订酒店票务类:电影票、演唱会票、景点门票、展览门票、博物馆预约查询类:快递物流查询、订单状态查询、附近商家/POI检索、营业时间查询充值缴费类:手机充话费、加油卡、水电燃气、ETC模糊本地服务表述:"我想吃饭","附近有什么好玩的","帮我找个能X的小程序"基于上一次小程序操作截图的追问/微调(如"换成大杯","看第二家","下一场")
## 不触发条件纯知识/资讯问答 → 走通用问答用户明确要求用 App、网页、桌面客户端完成(非小程序)→ 走对应渠道调用非微信生态平台(如直接调淘宝API、抖音内部操作)→ 不属本 Skill与微信账号/支付/隐私设置相关的系统级操作 → 走客服/系统设置用户只是闲聊、打招呼、表达情绪 → 走通用对话
比如说,我说定个周六晚上的我家附近的电影票,因为我让他记住我家在哪了,所以他知道,然后他会列出目前他可以操作的小程序,然后使用第一个来为我们服务。
小程序支持的还真的蛮多的。

一个电影就列出了5个,然后他选了第一个猫眼进行操作。
小微有一个很棒的点就是,他虽然没有办法帮你直接操作完小程序,但是他会一直操作到,他能操作的部分,然后把剩下的交给你,你接着Agent的步骤,做完后续的部分就行。
比如猫眼这个。
因为我没有指定电影院,我只说了家附近,所以他会先自己操作一会猫眼,最后给我停在玩具总动员5的影院选择界面,我点进去就是列表页,我选个影院就行了。

小微在小程序的操作适配上,这一点我觉得做的还是非常棒的。
除了这个主入口之外,小微的各种小入口,依然还是无处不在。


我能找到的,就有5个。。。
本质上都是一些快捷入口,不过比较特别的就是在群聊对话界面和个人对话界面,这两个的底部菜单栏唤出的小微,是带有了聊天记录的上下文的,这个是主入口里也做不到的。
而且微信居然会把聊天记录的权限在特定的入口里给小微开放出来,这个点,就已经完完全全的超出我的预期了,我以为这个纯粹的0.0.1的内测版本,是不会有聊天记录的,因为这个对于微信来说,就是纯粹的命根子。
比如我直接在两个群聊里面问。

不过这个时效性,跟朋友圈是一样,只能拿到最近2天的数据,拿不到更久以前的。
私聊也是如此,只能拿到最近2天的聊天记录,这个微信卡的非常严格。
除了这些东西之外,你从主入口的小微点进去,右上角的更多里面,其实还藏了一些功能。
比如这个记忆,其实就是会记录下你的部分的信息,比如我就让它记下了我家和公司的地址。

我就可以实现,直接说帮我打车去公司。

然后还有一个比较离谱的东西,就是那个小工具。
点进去以后,你就发现,你是可以,直接用一句话,来创建你想要的小工具的。

比如我就直接昨天一句话,创建了一个体重变化的小工具,这个玩意,是纯粹给我自己用的。

我其实觉得,这玩意有点杀死比赛的意味了。
因为,这个小工具,是完完全全复用的小程序的逻辑和架构。

现在虽然不能转发,但是做这个页面,明显就是未来为了分发而预留的口子。
过去一年时间,出现了无数的AI生成小程序小游戏的平台,大家都觉得,这感觉是个很棒的市场,因为有很多的创作者来这个平台上面做应用,然后就有可能,成为未来的新时代的APP store。
软件这个形态未来还是不是主流咱们另说,咱就说一个点,做过互联网产品的人应该都知道一个概念,双边市场。
平台的价值来源于同时连接两端,供给侧和需求侧。
平台最难的事情,永远是同时把两端的用户聚起来,也就是经典的冷启动困境,没有消费者就没有创造者,没有创造者就没有消费者。
但是过去一年多时间,大家最大的困境都是,只有创造者,但是,消费者不来。
但微信没有这个问题,微信有14亿用户,他的起点,是无数产品这一生的终点。
在微信里生成一个小程序,它天然就在全中国最大的消费者池子里,分发路径、用户基数、支付体系、社交关系链,全是现成的。
你做的每一个小程序,从诞生那一刻起就自带分发能力,因为微信本身就是分发。
所以,当微信自己进军,用AI直接生成小工具的赛道,很多其他的AI生小程序的产品,我觉得就非常的难受了。
整个小微大概就是这样。
能体验的部分、他们的部分技术调度我也都给大家展示了。
整个第一版,虽然还是只读不动。
但其实权限开放的已经有一点超我预期了。
毕竟,平台的信任是一种不可再生资源,透支了就很难恢复。
对于微信来说,出一点点的事,那都是无比大的大事。
而今天,微信也在用着非常微信的方式,把自己十几年积累的上下文资产和分发网络,用一种极其微信的节奏,接入AI时代。
我是从2012年开始用微信的。
到今天为止,差不多用了14年。
回望过去我印象中所有的大更新,我觉得没有什么,比这次更大了。
这是新时代和旧时代的区别。
也会在互联网和AI历史上,留下浓墨重彩的一笔。
