Sora2的发布,再次搅动了全球人工智能行业的神经。
9月30日,OpenAI正式推出其视频生成模型的重大升级版本——Sora2,以及基于该模型的社交应用Sora App。与前一代相比,Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升,并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”,也让视频生产“像写字”一样简单。
短短五天,Sora App下载量便突破百万次;应用分析机构App Figures数据显示,其首周iOS下载量达62.7万次,高于ChatGPT首周的60.6万次。尽管Sora App仍处“仅限邀请”阶段,但它的下载量增速超过了当年的ChatGPT。有观点称其为AI版的“TikTok”,被寄望成为下一个全球现象级应用。
在国内,Sora2同样掀起热潮。国庆期间,OpenAI CEO萨姆·奥特曼成为社交媒体上流量担当。他开放了个人肖像权,点燃了网友们的创作热情,其数字分身从商店偷GPU被抓包、与李小龙对打。这些病毒式传播的短视频,也加速了Sora2的出圈。
除了用户端,Sora2的发布也让行业按下了加速键。大厂加速产品迭代,10月15日,百度宣布旗下视频生成模型百度蒸汽机再次升级,支持AI长视频实时交互生成;次日,谷歌发布视频模型Veo3.1与Veo3.1Fast,主打更丰富的音频、更强的叙事控制和真实感。与此同时,创业团队也在全力冲刺。多位AI视频的创业者向「定焦One」透露,他们最近一直在加班,两位创业者甚至只有在深夜才有时间接通电话。
如今,公众热度已趋平稳,但在AI行业内部,一场静悄悄的技术竞赛,正在全速展开。
追赶Sora2的人
仿佛一声发令枪,Sora2让AI视频领域进入“超级加速”阶段。
国庆假期刚过,社交媒体上便传出消息:快手AI团队假期8天无休,全力追赶Sora2的技术进度。
主攻AIGC创作的纪录片、广告片导演丁一向「定焦One」透露,据他了解到的情况,几乎所有国内AI视频创业团队都已进入“全员加班”状态。他预测,不出两个月,国产版Sora2类产品可能就会出现,“所有的大厂、模型厂商都卷起来了”。
好耶科技创始人吴杰茜也证实了这种紧迫氛围,其团队同样连轴工作,对Sora2进行测试、拆解。她的创业项目FilmAction是一个AI电影生成平台,与Sora2在功能上有不少重叠。Sora2的横空出世,让她既兴奋又有压力——兴奋于技术的天花板被再次抬高,焦虑于行业的迭代速度超出了所有人的想象。
Sora2发布仅半个月后,谷歌于10月16日推出Veo3.1与Veo3.1Fast,被普遍解读为正面迎战OpenAI的举措。
同一天,OpenAI也宣布Sora2两项升级:Pro用户现可通过网页端使用“故事板”功能,同时全平台视频生成时长获得提升。普通用户可在App及网页生成15秒视频,Pro用户网页端更支持生成25秒内容,较此前标准版10秒、Pro版15秒的设定显著延长。
“这像极了ChatGPT刚出现时的那一刻,”吴杰茜说,“所有人都在拼命追赶。”
综合多位从业者的说法,Sora2的震撼来自于三个层面的技术突破:
首先,是物理世界的拟真突破。Sora2能精准模拟水流、光影、重力与碰撞效果,甚至处理浮力与重心转移等复杂物理场景,极大提升了人物动作的连贯性与主体稳定性。
其次,是多模态融合。Sora2可直接生成同步音频,自动匹配环境声、动作音效与多语言对白。在此之前,只有少数几个软件有此功能,但音质差不说,人物的语音和口型往往也不匹配。丁一团队还试着用不同的方言对Sora2进行测试,口音自然,口型精准,足见其技术成熟度。
Sora2真正的颠覆,并非仅是生成视频的“以假乱真”,而在于它理解了“镜头语言”。
吴杰茜的测试印证了这一点:她将小说或剧本原文直接输入Sora2,生成的视频不仅画面与文本高度契合,其镜头运用、节奏把控等视听语言,更是达到了专业创作者的水准。
要知道,在Sora2出现之前,AI视频创作始终受制于“镜头思维缺失”。过去,创作者需先手动拆解剧本,反复琢磨镜头衔接逻辑、人物视角选择、场景转换方式,耗费大量时间。市面上多数AI工具也只能生成单个简单镜头,若想串联成连续叙事,还需用户具备专业的视听语言知识与分镜设计能力,门槛并不低。
Sora2打破了这一局限:用户只需一句话的文本指令,它便能自动生成包含多镜头切换、剧情连贯推进的完整视频。换句话说,Sora2不再是单纯的“画面生成工具”,而是初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。
“如果把Sora2比作一位剪辑师,那么他的能力已经超越了市场上95%的人。”在丁一看来,其他AI视频软件目前还只是辅助工具,但Sora2一定程度上已经具备“智能体”的雏形。
创作门槛坍塌:AI正在重写“专业”
但技术狂奔的另一面,是行业秩序的松动。当AI视频进入“后Sora时代”,最先感到震动的,往往是那些曾依靠专业壁垒生存的人。
“既兴奋又焦虑。”丁一如此总结Sora2发布二十天来的心情。
他的团队是首批测试用户,结果Sora2几乎立刻改变了他们的工作方式。在现在丁一团队的工作流程中,Sora2已经深度嵌入,承担了很多前期的筹备工作,比如说分镜头的设计。注册四五个账号,可以快速的生成大量方案,并从中抽取最满意者。效率比人工快太多,而且质量也不差,包括视频概念、气氛、镜头运动方式这些因素都在其中。
Sora2一句话便能生成15秒成片,这意味着他们团队平时接的一些便宜的商单,基本上没有了技术门槛。他告诉「定焦One」,目前Youtube上的一些小推流广告,已经在使用Sora2生成。
另一位创作者等登等噔(以下简称“等登”)也受到了震动。
在最新的一支短片中,他用Sora2完成几个分镜头的构思:先上传参考图片,再用文字描述故事背景与情节,Sora2便能自动生成包含3-4个分镜头的视频,完整呈现剧情。而且据他测算,平均操作3次就能得到符合预期的版本,“抽卡率”远高于其他软件。
技术进步带来的创作便捷性让他感叹不已,但兴奋过后,等登心中也有一丝不安:分镜设计曾是专业创作者与普通用户的分水岭,但Sora2正在抹平这个门槛。
等登告诉「定焦One」,在Sora2出现之前,还没有哪个软件是支持分镜头自动生成,部分软件可以做到一些简单的分镜头,但还是需要使用者明确的提示词,比如第一个镜头是什么、第二个镜头是什么,然后它会在十秒内给出一个分镜头的组合。
Sora2可以直接生成一个动态视频。比如有网友将归有光的《项脊轩志》最后一句输给Sora2,生成的视频第一个镜头是归有光和枇杷树的特写,第二个镜头是归有光与妻子种植枇杷树的回忆,回忆镜头与归有光睹树思人的镜头来回切换。在这个视频里机位、角度以及镜头的切换AI都已经设计好了。
在AI时代,由于技术进步,带来的专业壁垒的消解,可能是很多人都需要面对的课题。
AI导演、AI分镜师等新职业原本是AIGC带来的新红利,但随着Sora2具备“理解剧本”的能力,这些岗位或许也会被再次淘汰。
丁一对此感触尤深。
他入行时也是一名分镜师,后来进入导演组、成为执行导演,最终一步步做到导演。过去只要精通一项工具——哪怕是Photoshop,就能找到工作。而现在,纯技术岗位的空间越来越小。今年早些时候,他拍的一个实验性质短片试图找过一些分镜师,但最后只能不了了之,因为“效率太慢了、沟通成本也很高”。
焦虑之后,他也开始调整心态。最起码从现阶段来看,AI生成的内容最终成果还是需要人的把关,个人的经验、审美、判断都会对最终的结果产生影响。丁一相信,未来人类的工具就是交互式的AI,就像现在的笔和键盘一样,但最终比拼的仍旧是内容和创意。
英伟达CEO黄仁勋曾对媒体说:“如果世界没有新的创意,AI的生产力提升终将转化为失业。”在Sora2带来的剧烈震荡中,这句话显得格外应景。
从“技术奇观”到现实考题
在AI应用层出不穷的时代,爆红与冷却往往只隔几天。很多人也在观望,Sora2是否只是“昙花一现”。
从热度来看,Sora2的确已经降温。
微信指数和百度指数显示,Sora2在国内热度高峰仅维持数日后迅速回落。等登认为,一方面国内用户无法直接访问Sora2,另一方面清晰度与水印限制也让创作者难以商用,从而削弱了话题度。
Sora2近30天微信指数走势截图
吴杰茜则指出,作为新闻事件,它注定会降温;但作为新的创作工具,它的普及才刚开始。
从前景上看,东莞证券的研报也佐证了这一观点,认为Sora2及其配套社交应用的发布,标志着AI视频生成与社交互动进入融合阶段,“有望重塑内容创作和分发生态,或迎来AI视频生成的ChatGPT时刻。”
回顾语言模型的发展史,ChatGPT的出现是AI从实验室走向大众的决定性转折点。从这个意义上讲,Sora2也标志着视频生成领域的一个关键拐点——即从技术尝鲜迈向普遍应用。
但类似Sora2这样的产品要想成为全民表达的工具,需要克服的不仅仅是技术难题。
首先是版权的迷雾。Sora2初期采取的“选择退出(Opt-out)”机制,默认可以使用互联网公开内容训练模型,将维权举证责任推给版权方。这种做法迅速招致了好莱坞经纪公司、美国电影协会乃至日本政府的强烈抵制和法律威胁。
面对集体施压,OpenAI迅速调整了策略,奥特曼宣布放弃Opt-out,转而采用更审慎的“主动同意(Opt-in)”模式,即需版权方签署明确授权协议才能使用其IP。奥特曼还建议引入IP分成收益机制,与授权方共享平台收入。
有律师认为,OpenAI的这一机制将矛盾从法律博弈转向商业合作。尽管仍有局限,但它预示AI行业正迈向付费许可与生态共建的新阶段。一位好莱坞制片人的评论颇具代表性:“未来的影视公司,其运营模式可能更趋近于版权管理机构,而非传统的内容制造者——这一趋势几乎无可避免。”
其次是变现模式的拷问。目前Sora2的主要使用场景仍以娱乐为主,如生成趣味视频或表情包。这类低价值、高频交互难以支撑庞大的模型训练与运维成本。未来,专业用户或高质量内容创作者的“付费模式”或将成为主流。如何在广告变现与用户体验之间取得平衡,仍是所有AI视频厂商的共同考题。
这些现实的疑问和战略调整,勾勒出AI视频行业从“野蛮生长”转向“理性发展”的轨迹。
用丁一的话说,随着Sora2的出现,全球AI视频赛道正迈向更高维的竞争阶段。各家模型厂商“卷”得更深,训练数据涵盖影视、动漫、广告、纪录片等多种素材,“AI正在学习全人类的影像史”,而当技术卷到极致,拼的将不再是算法,而是创意与落地能力。”
Sora2发布二十天后,世界或许并未立刻改变。但在每个AI视频创作者的电脑上,故事的生成方式,已经悄然不同。