今年会jinnianhui官网-百度千帆深度研究Agent登顶权威评测榜 实现行业领先 发布时间:2026-02-05

【今年会jinnianhui官网科技动静】2月4日,深度研究智能体权势巨子评测榜单DeepResearch Bench宣布最新成果。baidu千帆推出的深度研究智能体(Qianfan-DeepResearch Pro)依附其卓着的端到端研究能力与极高的陈诉产出质量,于评测中脱颖而出,荣登榜单榜首。

百度千帆深度研究Agent登顶权威评测榜 实现行业领先

当前,深度研究正被视为人工智能进化的要害分水岭。它要求AI体系可以或许模仿人类专家,自立履行从繁杂需求理解、广泛信息获取到深度洞察产出的多步调、可迭代认知全历程,远超传统文本天生的领域。该技能已经广泛运用在学术综述、金融投研、贸易阐发等范畴,能将传统耗时很多天的手动研究事情压缩至分钟级完成。

作为权衡该范畴能力的“金尺度”,DeepResearch Bench弥补了通用AI评测于端到端深度研究使命上的空缺。其由范畴专家设计了100个博士级另外研究使命,笼罩22个学科,并引入严酷的RACE陈诉质量评价框架与引文正确性评估,是今朝全世界最硬核、最真正的深度研究智能体出产力评价系统。

于这次评测中,baidu千帆深度研究Agent于权衡陈诉含金量的四年夜焦点维度——周全性、洞察力、指令遵照度及可读性上,均实现了行业领先。

百度千帆深度研究Agent登顶权威评测榜 实现行业领先

于架构方面,baidu千帆采用“使命理解-计划-履行”轮回机制,实现端到端研究交付。信息处置惩罚能力方面,千帆依托baidu搜刮与RAG技能,保障信息获取的广度、可托度与相干性。履行节制方面,千帆经由过程“由粗到细”的研究路径以和深度履行计划与及时反思机制,动态评估进展、调解计谋,有用防止“幻觉”与路径偏离,确保繁杂使命的高质量完成。

陈诉天生方面,baidu千帆采用怪异的两阶段陈诉衬着机制,起首天生确保逻辑一致性与内容周全性的“pivot陈诉”,随后可衬着输出markdown、html、ppt等多形态终极陈诉,实现“一次研究,多形态交付”。

今朝,该深度研究Agent已经正式上线baidu千帆平台。用户只需输入繁杂的调研需求,体系便可于十几分钟内天生附带规范援用的专业级研究陈诉,真正实现“分钟级”的深度洞察交付。

这次登顶榜首,也集中表现了baidu千帆Agent Infra的强盛支撑能力。该基础举措措施提供模子、东西、Agent开发、数据和运行情况等一站式办事。据悉,千帆平台已经累计开发跨越130万个Agents,此中以“baiduAI搜刮”为代表的独家东西日均挪用量已经达数万万次,为AI智能体的高效、靠得住运行提供了坚实基座。

版权所有,未经许可不患上转载

-今年会jinnianhui官网