借力万相2.6,开放“AI小剧场” 千问App拿下3000万月活后的下一场豪赌:视频社交化?

AI视频生成,正在追求变得好玩?

12月16日,阿里千问App(应用程序)同步上线最新视频生成模型万相2.6,并向所有用户免费开放。《每日经济新闻》记者了解到,基于该模型的核心能力,千问App上线了“AI小剧场”功能(即基于该模型的角色扮演新功能),在国内首次实现了“角色合拍”玩法。

记者体验千问App后发现,点进“AI小剧场”,的确可以和知名角色、历史人物合拍视频。

根据示例,输入简单描述,“苏轼”就能穿越时空被高考难到崩溃;只要上传自己的照片录入角色,就能和美国队长出现在同一视频中,接受他送的玫瑰花。此外,视频生成后,还可以一键分享链接到微信好友、朋友圈和QQ好友。

值得注意的是,这一功能对标的正是Open AI旗下的Sora2。“AI小剧场”玩法目前仅Sora2大模型有类似功能,而Sora2的优势便在于,其同步上线了内容社区,开启了AI内容社区化时代。

当前,在AI视频生成领域,中国企业和美国企业正展开激烈竞争。根据招商证券统计,目前,该领域已有15个以上被广泛认可的模型。在此大背景下,阿里持续加码视频生成赛道意欲何为?

对标Sora2,阿里持续加码视频生成

事实上,今年以来,阿里持续布局视频生成赛道。

2月,据阿里云披露消息,阿里云视频生成大模型万相2.1(Wan)重磅开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。

而在今年9月的云栖大会上,阿里发布通义万相Wan2.5 preview系列模型,首次实现音画同步的视频生成能力,视频时长从5S提升至10S,支持24帧每秒的1080P高清输出,通义App第一时间接入了视频生成模型。

11月17日,阿里正式宣布“千问”项目,全力进军AI to C市场,“通义”App正式改名为“千问”App。12月初,千问App便已接入万相系列当时的最新模型Wan2.5。

这一次,千问App第一时间接入的万相2.6视觉大模型,支持音画同步、多镜头生成及声音驱动等功能,号称是全球功能最全的视频生成模型,也是国内首个支持角色扮演功能的视频生成模型。阿里方面表示,这次更新的万相2.6,有的功能比如音频驱动生成视频,Sora2尚未实现。

为何这次千问卯足了劲对标Sora2,双方之间究竟差距何在?

根据华泰证券相关研报,9月30日,Open AI发布最新音视频生成模型Sora2,并同步试运行由该模型驱动的iOS社交应用Sora。

该研报认为,Sora此次较大的突破在于推出AI社交平台,有望通过双边效应实现自我强化,进一步降低内容创作的门槛,吸引全球开发者与普通用户共创内容生产,并通过垂直分发机制提升内容消费效率,有望创造新型社交场景。

有观点认为,Sora2及其配套社交应用的发布,标志着AI视频生成与社交互动进入融合阶段,或迎来AI视频生成的“ChatGPT时刻”。

工信部信息通信经济专家委员会委员盘和林对《每日经济新闻》记者表示,如今,在AI大模型算法能力上,中国相对较强,具备追上Sora2的能力,且阿里本身具备比较丰富的数据资源和算力资源,即便短期有些性能差距,阿里千问也能通过持续的算力和数据投入来解决问题。

“性能上应该是能够无限接近Sora2。当然,现阶段还是有些差距的,多是一些生成细节上的差距。”盘和林说。

记者在千问App实测“AI小剧场”功能发现,在选择现存示例进行“AI翻拍”的情况下,其视频生成时间一般在2到5分钟,可生成一段10秒视频。

不过,当记者输入描述,要求“孙悟空和财神拥抱”时,千问App的理解并不到位,给出了前后不相关的数个视频画面,包括孙悟空举起玫瑰花、两个财神拥抱。

千问App月内狂推18个版本,阿里“硬刚”Open AI背后的豪赌

就视频生成赛道而言,千问App在国内也有不少竞争对手。

同样在12月16日,字节跳动旗下“即梦AI”网页版官宣全面升级,打造一站式“AI片场”。此次升级核心是即梦AI最新视频生成能力“视频3.5 Pro”,支持视频与音频同时生成,人物口型、乐器演奏、环境音效等元素无需再后期配音,提升视频的真实感与沉浸感。

今年12月,快手旗下“可灵AI”推出视频生成2.6模型。据介绍,该模型提供了“音画同出”能力,能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频。目前,其语音支持生成中文与英文,生成的视频长度最长可达10秒。12月5日,可灵AI宣布,可灵O1主体库和对比模板两大功能全新上线。

盘和林认为,各大视频生成AI之间,差距都比较小。“千问视频生成能力应该和即梦、可灵在同一起跑线。”他表示,因为各家在算法、算力、数据等基础上处于近似的水平,AI视频生成应用是这些基础的结果而已。

值得一提的是,这些大厂共同争夺的,是一个广阔的市场前景。

招商证券相关研报提及,根据Grand View Horizon,2025年全球AI视频生成市场规模预计达8亿美元。在其基本情形假设中,预计AI视频生成可触达市场规模接近400亿美元,包含B端规模360亿美元(90%占比)和C端规模40亿美元(10%占比)。

不过,12月13日,据《中国经营报》报道,近日,硅谷风投机构a16z合伙人Olivia Moore在社交媒体爆料称,Sora的下载量仍在增长,但早期用户留存率数据看起来相当疲软。他晒出了一张App数据监测服务SensorTower的数据截图:Sora的1天、7天、30天和60天用户留存率分别为10%、2%、1%和0%。

不过,就阿里在AI上的整体布局来看,千问App上线“AI小剧场”的诉求未必是剑指AI视频生成市场这么简单。千问App刚上线时,阿里便宣称,其要与ChatGPT展开全面竞争,此次推出视频生成新玩法,或是试图缩小与Open AI的综合差距,为正面抗衡铺路。

截至12月17日,千问App公测已满一个月。一个月来,这款App共计更新18个版本,正加强创作、学习、办公三大场景能力。12月10日,阿里官方信息显示,自11月17日公测仅23天,千问月活跃用户数(含App、Web、PC端)已突破3000万,成为当前全球增长最快的AI应用。

组织架构的调整也在进行中。12月9日消息,阿里已成立千问C端事业群,由阿里巴巴集团副总裁吴嘉负责。据媒体报道,阿里在内部沟通中提及,千问C端事业群的首要目标是将千问打造成为一款超级App,成为AI时代用户的第一入口。

AI视频生成的战场硝烟弥漫,时至如今,这场较量不仅是技术参数的比拼,更是各家生态能力与用户洞察的对决。在此大背景下,在AI赛道上,阿里若想“硬刚”Open AI,需要做的还有很多。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平