界面新闻记者 | 佘晓晨
界面新闻编辑 | 文姝琪
2021年,各种数字人开始出现在直播间、广告画面和影视短剧中,横空出世的“柳夜熙”一度让数字人成为风口。但在大模型出现之后,谈论这一概念的公司却在减少,取而代之的是AI智能体、AI助手。
理论上来说,大模型的爆发实际上让3D数字人拥有更强的对话能力,对其商业化应用也会有所助力。但现实情况为何并非如此?
一位从事AI虚拟陪伴的创业者向界面新闻表示,市场上的数字人公司越来越少,核心原因在于没有AI能力。尤其是在3D数字人领域,大模型的爆发实际上对公司提出了更高的要求。
中商产业研究院发布的报告显示,2024年2D数字人落地较迅速,市场占比达到70.1%。3D数字人市场份额较小,占比29.9%。核心原因就在于,3D数字人仍受限于技术的迭代速度。
一位和多家数字人公司合作过的LED显示屏厂商CEO向界面新闻表示,数字人行业存在一个现象:头部公司产品优秀,但整个行业产品质量参差不齐,且GPU成本较高、服务不稳定,难以实现7×24小时无差错服务。
曾做出国风虚拟人“翎Ling”的3D数字人公司魔珐科技入局较早,是留在牌桌上的公司之一。对于行业的变化,魔珐科技创始人兼CEO柴金祥教授认为,很多公司之所以被淘汰,就是因为在AI大模型已经规模化的时候,数字人的能力却没有匹配上大模型。“大模型是语言能力,数字人是身体的能力,如果大脑很强,身体配不上,当然就没有用。”柴金祥直言,此前很多数字人公司没有走AI研发的路线,能力也会相对受限。

图片来源:图虫创意
柴金祥拥有美国卡内基梅隆大学人工智能与机器人专业博士学位,二十多年前开始3D数字人相关研究。他在接受界面新闻采访时表示,未来想要做好3D数字人,需要高质量数据积累、稀缺人才储备以及强大的美术能力等等。
但无论是在数据还是人才方面,数字人公司都存在一定瓶颈。例如在数据层面,目前文生图片和视频等数据已经相对丰富,但涉及人体动作和环境交互的3D数据仍然较为稀缺,而大部分公司没有积累数据的能力。此外,柴金祥提到,一直以来,做3D内容和研究AI的人才就是“割裂”的,将两种类型的人才聚集到一起也有难度。
大模型的爆发加速了行业的洗牌和分化。当下的一个趋势是,3D数字人的制作开始向平台化发展。
平台化的前提是市场的接受程度。一位行业人士告诉界面新闻,目前很多提供数字人方案的公司,落地领域都集中在展馆、文旅景区、教育培训等场景,工具化的属性更强。这离不开政策的加持——今年以来,各地发布鼓励人工智能发展的战略,促使很多机构重视数字化的应用。
更重要的是,AI技术的进步加速了整个产业链成本的降低,让真正的规模化成为可能。
受限于质量、成本、延时三个难题,以往3D数字人无法大规模应用。但如今情况有所不同。IDC中国人工智能研究经理程荫在一份报告中表示,在生成式AI和大模型技术的驱动下,AI数字人的技术架构升级:头部厂商依托语义和垂直领域大模型,构建起新一代数字人技术栈;多模态能力持续突破,表情生成、动作捕捉、语音合成、视觉理解等关键技术模块通过超大规模预训练,推动数字人在形象、交互和自主决策等方面的提升。此外,AI的普及,也降低了很多终端设备部署数字人的成本。
基于自主研发的文生多模态3D大模型及云-端协同架构,魔珐科技近期上线了具身智能3D数字人开放平台,供开发者使用。根据魔珐科技的公开演示,开发者可以在3分钟内完成数字人接入。据界面新闻了解,目前这一开发平台在数字人客服、培训助手、导购等岗位实现应用。
在2021年接受界面新闻采访时,柴金祥就提到公司的发展方向是平台化。但直到现在,技术条件才逐渐成熟。柴金祥认为,伴随着智能化的升级,近几年来AI已经可以写文章、编程序甚至做决策,并且可以调用各种API成为智能体,但AI依然缺少“身体”。按照他的判断,有了大模型支撑下的“大脑”,3D数字人更大的市场是扮演白领的角色,而开放平台可以成为基础设施。
今年8月,聚焦数字人领域的影眸科技完成新一轮数千万美金融资,宣布将在其3D生成平台中上线百亿参数级新模型。百度则在今年发布数字人技术nova,同样往平台化发展。
从进入大众视野到成为风口,再到逐渐受到外界质疑,数字人的商业模式始终是核心命题,但这不仅涉及技术的进步,还有伦理边界。今年618期间,罗永浩数字人在百度电商开播,开播26分钟的GMV超过真人带货1小时。但是从2024年开始,不同平台已相继发布规则进行监管,数字人主播并未如想象中普及。
可以确定的是,更多开放平台的出现,将降低数字人制作的门槛。但数字人将如何在AI时代发挥作用,和诸多AI应用的发展一样尚无定论。
