9月13日,在2025年中国软件研发创新科技峰会(CSDIsummit)现场,人工智能与产业融合的深度实践成为核心议题。营销作为AI最快落地领域备受瞩目。明略科技高级技术总监吴昊宇受邀出席峰会,以“寒武纪生命大爆发”类比,深入剖析当前营销行业正在经历的剧烈变革,发表《智能Agent在生成式营销中的落地闭环》主题演讲。
明略科技高级技术总监吴昊宇,图片来源:明略科技
吴昊宇指出,2024年,短视频、内容电商、社交媒体广告在品牌预算占比的大幅提升,这一趋势在2025年持续深化,同时为行业带来三大挑战:
内容生命周期急剧缩短:传统广告素材可复用1个月以上,而当前效果类、电商类广告的有效周期仅3天左右,随后CPM(千次曝光成本)与转化效率会大幅下滑;
用户路径从“主动”变“被动”:传统电商是用户“有需求→搜索→比价→购买”,而内容电商则是用户“被动刷到→内容吸引→情绪共鸣→冲动下单”,品牌若不能在3秒内抓住用户注意力,传递核心卖点,广告即失效;
内容产能与质量矛盾突出:品牌若需要每周产出大量优质视频,延续传统制作模式难以实现,亟需标准化、智能化的生产体系。
2025年大模型技术的突破性发展,恰好为应对这些挑战提供了关键支撑,成为营销行业在“寒武纪变革”中破局的核心动力。
从技术能力看,大模型已从单一语言交互升级为多模态协同,不仅能“看图说话”,更能跨文本、语音、图像灵活生成内容;推理能力实现质的飞跃,不再是简单输出碎片化内容,而是能做到“说得有逻辑”,进行复杂的内容脚本创作。
从应用落地看,大模型成本的快速下降,进一步降低了营销智能化的门槛。此前,顶尖模型的大规模应用多局限于头部企业,2025年,中小品牌也有机会根据自身需求搭建专属智能营销体系。
那么,对于企业来说,如何推动AI在营销场景快速落地?明略科技高级技术总监吴昊宇结合公司在大模型领域的技术探索,从“感知-认知-行动”三个层面,拆解了当前营销技术创新的可落地方案。
以下内容摘录自其演讲原文:
一、感知系统:看到的要真,听到的要全
感知系统是整个营销Agent的基础。企业在营销洞察环节,时常面临三个核心痛点:
一是深度分析取数做不对——口径不一、第三方榜单失真,甚至连价格字段都可能抓漏,导致数据无法支撑决策;
二是全景社媒库不完整——平台割裂、圈层语言不同,中腰部KOL投放,以及用户二创内容很难追踪,看不到完整的市场动态;
三是爆款内容解析不到位——抓不住黄金3秒的关键,卖点跟用户痛点脱节,内容风格还和平台调性不匹配,学不到爆款的核心逻辑。
针对这些问题,我们用三项对策解决:
第一,打造统一口径的可信商业Agent系统——通过专业模型获取数据,确保取数口径一致、数据真实可信;
第二,构建覆盖多平台与人群的最全社媒数据+AI洞察——我们每天处理超1.3亿条数据,自动解析数百万的视频和图片内容,构建380多个维度的内容和用户标签,覆盖主流社交平台和新闻站点,让品牌能看到完整的市场动态;
第三,做好爆款拆解+AI理解——把爆款视频从“视频-片段-分镜”三级拆解,将开场三秒、证据镜头、节奏、封面等关键要素指标化,让品牌知道“爆款为什么爆”,并能直接复用核心逻辑。
这里要特别提一下我们的深度分析Agent框架,它是感知系统的“核心引擎”,确保数据精准、可信:
多智能体协作体系:让专业的Agent做专业的事;
智能体工作流引擎:自动构建与执行流程,把一次跑通的好路径变成“模板+清单”,下次用的时候一键就能启动,不用重复试错;
长短期记忆管理机制:短期记忆保证单次任务连贯,长期记忆把经验沉淀成“避坑手册”,下次少走弯路;
多模态专业模型和API:优先对接高可信数据源,确保每一个数据都有来源、可追溯。
另外,我们还有两个专有模型支撑感知:一是Cito专业指令推理模型,能把用户模糊的需求转换成可执行的任务链路;二是Mano专业灵巧手模型,只要说清目标和规则,它就会用“Plan→Action→Verify”的闭环在浏览器里操作,每一步都有截图留痕,还能在线强化学习,越用越准。
Mano模型框架概览,图片来源:明略科技
二、认知系统:让内容效果可预测、可优化
如果说感知系统是“找方向”,那么认知系统就是“判断好坏”。决定增长的不是生成了多少内容,而是哪条内容更好、为什么好。
认知系统的核心是从消费者角度出发,预测注意力、好感、信任等主观指标,在投放前就排除“低胜率”内容,避免测试经费浪费。针对品牌广告,我们要看内容是否符合品牌认知一致性、能否强化品牌记忆;针对效果广告,我们会重点看黄金3秒吸引力、信息传递效率,确保内容能打动用户。
为了把“专家看片”的直觉转化为可落地的指标,我们分三步走:
第一步,把内容交给我们自研的明敬超图多模态大模型——它会基于采集到的脑电、眼动等非标模态数据,预测观众的主观反应;
第二步,生成客观证据线——模型自动生成整体与逐秒的内容描述,解码核心信息是否传达到位,比如产品卖点有没有讲清楚、品牌标识有没有足够曝光;
第三步,接入MOE多专家推理——让洞察、创意、行业、广告法等“虚拟专家”一起审核,最终输出内容的优势、劣势和优化建议,比如“黄金3秒该换成哪种模式”“文案风险点在哪”“封面和节奏该怎么调”。
这里要重点介绍我们自主研发的“明敬超图多模态大语言模型”,它的核心是把人类的主观认知“教”给了机器。简单来说,它不只是“看懂了内容”,还“看懂了用户是如何被打动的”。相关研究论文已经获得了ACMMM2024最佳论文提名。
明敬超图多模态大模型整体架构,图片来源:明略科技
为了保证模型的准确性,我们做了大量基础工作:采集了超过10万人次的真人广告测试数据。在主观视频理解测试基准Video-SME上,明敬超图多模态大模型多个版本都取得优秀成绩,在客观任务为主的Video-MME测试集上也排名前列,综合理解能力领先;通过对真人样本广告创意测试的平均分,以及模型预测得分进行回归分析,样本一致性高达89%,这表明模型与人类主观评价已具有较高的相关性,非常接近人类判断的能力。
在具体场景中,模型不仅能快速实现广告创意效果预测,还能基于预测给出具体的优化建议,从而辅助品牌有针对性的调整内容。
三、行动系统:让创意快速落地为可投放内容
行动系统是“最后一公里”,基于感知和认知的结果,行动系统可以自动生成脚本、匹配素材、剪辑视频,打通从创意到投放的全流程。
举个汽车品牌的例子:我们先通过感知系统明确目标人群——在各自领域小有成就、希望享受生活但关注性价比的中青年,他们看重“恰到好处的驾控体验”和品牌调性;接下来,认知系统预测这类人群对“生活场景化内容”反应更积极;最后,行动系统结合这些洞察,自动生成视频剧本故事板,包括分镜描述、画面概念图、台词、演员建议等,甚至能直接调用素材库匹配画面,若没有匹配素材,可借助AI生成,最终快速产出可投放的视频。
随着AI技术的发展,营销行业已经进入了“后寒武纪时代”,不再是仅靠某个单点优势就能存活。真正的核心是“感知-认知-行动”三个系统的协同:有了真且全的感知,才能找准方向;有了能预判效果的认知,才能少走弯路;有了能快速落地的行动,才能抓住流量机会。
对于企业来说,机会就在于用好大模型,多去看目标用户的真实需求,多去拆优质内容的核心规律,多去试自动化的生产方式,把这三个能力练扎实。未来,明略科技会继续迭代“感知-认知-行动”系统,以更精准的数据、更智能的模型、更高效的工具,助力更多品牌在大模型时代抓住机遇,实现增长突破。