百度千帆深度研究Agent登顶权威评测榜 实现行业领先

【CNMO科技消息】2月4日,深度研究智能体权威评测榜单DeepResearch Bench公布最新结果。百度千帆推出的深度研究智能体(Qianfan-DeepResearch Pro)凭借其卓越的端到端研究能力与极高的报告产出质量,在评测中脱颖而出,荣登榜单榜首。

百度千帆深度研究Agent登顶权威评测榜 实现行业领先

当前,深度研究正被视为人工智能进化的关键分水岭。它要求AI系统能够模拟人类专家,自主执行从复杂需求理解、广泛信息获取到深度洞察产出的多步骤、可迭代认知全过程,远超传统文本生成的范畴。该技术已广泛应用于学术综述、金融投研、商业分析等领域,能将传统耗时数日的手动研究工作压缩至分钟级完成。

作为衡量该领域能力的“金标准”,DeepResearch Bench填补了通用AI评测在端到端深度研究任务上的空白。其由领域专家设计了100个博士级别的研究任务,覆盖22个学科,并引入严格的RACE报告质量评价框架与引文准确性评估,是目前全球最硬核、最真实的深度研究智能体生产力评价体系。

在此次评测中,百度千帆深度研究Agent在衡量报告含金量的四大核心维度——全面性、洞察力、指令遵循度和可读性上,均实现了行业领先。

百度千帆深度研究Agent登顶权威评测榜 实现行业领先

在架构方面,百度千帆采用“任务理解-规划-执行”循环机制,实现端到端研究交付。信息处理能力方面,千帆依托百度搜索与RAG技术,保障信息获取的广度、可信度与相关性。执行控制方面,千帆通过“由粗到细”的研究路径以及深度执行规划与实时反思机制,动态评估进展、调整策略,有效避免“幻觉”与路径偏离,确保复杂任务的高质量完成。

报告生成方面,百度千帆采用独特的两阶段报告渲染机制,首先生成确保逻辑一致性与内容全面性的“pivot报告”,随后可渲染输出markdown、html、ppt等多形态最终报告,实现“一次研究,多形态交付”。

目前,该深度研究Agent已正式上线百度千帆平台。用户只需输入复杂的调研需求,系统即可在十几分钟内生成附带规范引用的专业级研究报告,真正实现“分钟级”的深度洞察交付。

此次登顶榜首,也集中体现了百度千帆Agent Infra的强大支撑能力。该基础设施提供模型、工具、Agent开发、数据及运行环境等一站式服务。据悉,千帆平台已累计开发超过130万个Agents,其中以“百度AI搜索”为代表的独家工具日均调用量已达数千万次,为AI智能体的高效、可靠运行提供了坚实基座。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平