作者:王吉伟
十篇AI Agent报告,看懂2025年全球智能体行业全景,附下载十篇AI Agent研报,2025年智能体行业的全球洞察与趋势,附下载2025年AI Agent行业,十篇研报解读智能体的全球发展蓝图,附下载十篇AI Agent研报,2025年智能体行业的关键趋势与机遇,附下载2025年AI Agent行业全景,十篇研报解读全球智能体新纪元,附下载十篇AI Agent研报,了解2025年智能体行业核心趋势与挑战,附下载
全文约7500字,阅读时间15分钟
文/王吉伟
差不多每个春节前后,科技界都会有些“大事件”发生,尤其是这几年日新月异的AI领域。
往年都是国外产品吸引眼球,而今年换成了中国技术惊艳全球。
春节前幻方量化发布的大模型DeepSeek-R1,一经亮相便迅速炸场AI领域,全球的企业管理者、创业者、项目经理、分析师乃至相关部门领导人都现身说法,感慨DeepSeek-R1在大模型领域取得的突破性进展。
DeepSeek-R1在后训练阶段采用了大规模强化学习技术,使得在标注数据极少的情况下,依然能实现显著提升推理能力。这一技术的进步使它在数学、代码及自然语言推理等多项任务中,表现出可与OpenAI的最新版本相媲美的性能,真正实现了开源化。这意味着,AI领域正在朝着“低成本+高性能”方向迈进。
重要的是,基于DeepSeek-R1的browser-use 等很多智能体实操案例已经证明,DeepSeek能够有效降低部署AI Agent的门槛,能够大幅提升AI Agent性能和效率,增强场景适应能力。
在LLM Based AI Agent亟待落地的当下,一个高效且性价比可观的大模型对于智能体的重要性可想而知。可以预见,接下来DeepSeek-R1等强化学习类大模型,将会极大地提升智能体的构建与应用效率,进一步加速AI Agent的落地应用。
当然,在智能体成为AI应用主旋律的当下,春节前后更精彩的仍然是AI Agent行业,产品研发与生态扩建方面全球技术厂商都在马不停蹄。
谷歌于 2024 年 12 月发布了全新多模态大模型Gemini 2.0,其性能全面提升,支持图片、视频和音频等多模态输入与输出。基于Gemini 2.0架构,谷歌推出了三个新的AI智能体原型:通用大模型助手Project Astra、浏览器助手Project Mariner和编程助手Jules。其中,编程助手Jules能够直接集成到GitHub的工作流程系统中,分析复杂代码库并实施修复。
微软于2024年10月宣布在Dynamics 365中集成10个自主AI Agent,这些智能体能够自动执行客服、销售、财务、仓储等业务流程。这些AI Agent支持 OpenAI的o1模型,具备自主学习能力,可以自动执行跨平台的超复杂业务。例如,美国著名电信公司Lumen通过AI Agent每年能节省5000万美元成本,相当于增加了 187 名全职劳动力。
OpenAI在2025年1月24日发布了其首款AI Agent——Operator,该系统能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。2月2日正式推出面向深度研究领域的智能体产品深度研究(Deep research)功能。该功能可在5-30分钟完成专业报告,支持多领域高强度知识工作者,由o3模型提供支持,通过端到端强化学习训练,由四模块协同工作,已在ChatGPT上线,未来计划扩展数据源和结合Operator执行复杂任务。
Anthropic于2025 年 1 月发布了Agent最佳实践指南,旨在提升AI Agent在多个应用场景下的效率和灵活性。还计划在2025年推出智能体“AI同事”(virtual collaborator),能够编写和测试代码。其旗舰产品Claude 3.5 Sonnet升级版在OSWorld测试中电脑使用能力得分为AI模型中首位。
在国内,阿里云通义千问也于1月29日上线了超大规模的MoE模型Qwen2.5-Max。该模型预训练数据超过20万亿tokens,在多个基准测试中表现优异,整体性能优于DeepSeek V3。
通义千问还开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。Qwen2.5-VL和2.5MAX不仅在性能上取得了显著提升,而且在AI Agent尤其是computer use方面展现出了强大的应用潜力。例如,Qwen2.5-VL能够直接作为视觉Agent进行操作,推理并动态使用工具,支持在计算机和手机上完成多步骤的复杂任务,例如自动查询天气、预订机票、发送消息等。
各大科技公司都在用快速迭代的产品与解决方案,对外彰显其在AI Agent领域发展的绝对速度。从目前各领域的表现来看,2025年这个AI Agent商业化应用元年,智能体的落地应用比大家想象的要快得多,预示着AI Agent技术即将迎来爆发式增长,当然竞争也更为激烈。
这种情况下,自然会有很多朋友想要快速认知与掌握AI Agent。而了解一个行业最快的方式,莫过于先从阅读各种各种行业研报资料开始。
为了帮助大家更好地了解、学习与应用AI Agent,在2025年春节假期归来开工的第一天,王吉伟频道精心准备了10份智能体行业研报。
这些研报涵盖了AI Agent的最新技术进展、应用场景、行业趋势以及面临的挑战等多个方面,旨在为大家提供全面、深入的参考。无论是企业决策者、技术开发者还是对AI Agent感兴趣的读者,都可以从这些研报中获取有价值的信息,把握AI Agent带来的发展机遇。
本文提到的所有研报资源已打包(包含翻译版),后台发消息 研报2025 ,获取下载链接。
【PS:赠书福利见文末】
报告1:谷歌《Agents》白皮书
该白皮书探讨了生成式人工智能(Generative AI)模型如何通过使用外部工具来扩展其功能,从而形成所谓的Agents(智能体)。详细介绍了Agents的定义、认知架构、关键组件、工具使用、以及如何通过这些工具和架构来增强模型性能和实现生产应用。
它首先阐明了Agent区别于单纯模型的关键在于其能够利用工具访问外部信息,并进行自主推理和行动规划,而非仅仅依赖训练数据进行单次预测。
白皮书详细介绍了Agent的三个核心组成部分:模型(Language Model)、工具(Extensions, Functions, Data Stores)和编排层(Orchestration Layer)。编排层利用各种推理框架(如ReAct, Chain-of-Thought, Tree-of-Thoughts)指导Agent的决策过程。工具则赋予Agent与外部世界交互的能力:Extensions连接Agent与API,Functions允许客户端控制API调用,Data Stores则提供对外部数据的访问,支持RAG等应用。
最后介绍了在LangChain和Vertex AI平台上构建和部署Agent的方法,并讨论了如何通过各种学习方法(如上下文学习、基于检索的上下文学习和微调)提升模型性能。总而言之,该白皮书旨在系统性地讲解生成式AI Agent的原理、架构和应用实践,为开发者提供构建更强大、更灵活的AI系统的指导。
对于希望了解或构建Agents系统的朋友来说,是一份非常有价值的资源,推荐详细研读。
报告2:Anthropic《Building effective agents》
《Building effective agents》深入探讨了构建大型语言模型(LLM)Agent的实践经验与洞见。文章开篇对“Agent”一词进行了明确界定,并细致区分了工作流(Workflow)与Agent在架构上的不同之处。
工作流指的是对LLM和工具的预定义流程进行编排,而Agent则赋予了LLM动态调控其流程及工具使用的灵活性。还分析了在何种情境下以及如何有效运用Agent系统,并着重指出,在应用构建过程中,应优先采用最简洁的方案,并根据实际需求逐步引入复杂功能。
文章深入探讨了几种构建Agent的常见模式,包括增强型LLM、提示链(Prompt Chaining)、路由(Routing)、并行化(Parallelization)、指挥者-工作者(Orchestrator-Workers)和评估器-优化器(Evaluator-Optimizer)等,并强调了简洁性、透明度和周全的工具文档和测试的重要性。
这些模式旨在指导开发者构建高效、可靠且易于维护的Agent系统,而非追求过度复杂的系统。文章还提供了在客户支持和编码领域使用Agent的实际案例,并附录中详细说明了工具的提示工程技巧,以帮助开发者创建更有效的Agent-计算机接口 (ACI)。
此外,文章介绍了多种框架,这些框架虽然简化了实现过程,但也可能带来额外的抽象层,影响调试。因此,文章建议开发者直接使用LLM API,并在必要时使用框架,同时确保理解底层代码。最终目标是确保Agent系统的设计保持简洁,优先考虑透明度,并通过工具文档和测试精心设计Agent-计算机接口(ACI)。
《Building effective agents》报告能够为对AI Agent感兴趣的读者提供了全面且实用的指导。它不仅解释了AI Agent的核心概念和构建方法,还通过实际案例和建议,帮助读者更好地理解和应用这些技术。对于希望深入了解和构建LLM Agent的读者来说,这份报告是一份不可多得的参考资料。
报告3:LangChain《State of AI Agents》
报告通过调查超过1300名专业人士,揭示了2024年AI Agent的使用现状,包括它们在不同行业中的应用情况、主要用途、面临的挑战以及未来的发展趋势。
该报告将AI Agent的定义为使用大型语言模型(LLM)来决定应用程序控制流的系统。探讨了了不同类型的Agent框架,如ReAct、多Agent编排器和LangGraph等,这些框架在业界获得了广泛的关注。提到了AI Agent在不同行业中的应用,以及它们在处理研究、总结、个人生产力任务、客户服务等方面的具体用途。
报告发现,超过一半的受访者正在生产环境中使用人工智能Agent,而绝大多数受访者计划在不久的将来部署AI Agent。主要的应用案例包括信息研究和总结以及提高个人生产力,而客户服务也是一个重要的领域。报告强调了追踪和可观察性工具以及人工监督在控制AI Agent风险方面的重要性,并指出性能质量是部署AI Agent的最大障碍。
最后,报告分析了Cursor、Perplexity和Replit等成功的案例,并探讨了多步骤任务管理、重复性任务自动化以及AI Agent的协作等新兴主题。报告调查显示,不同规模的公司在AI Agent的控制和优先事项方面存在差异,大型企业更注重安全性和合规性,而小型公司更关注追踪和理解结果。
《LangChain AI Agent 状态报告》提供了关于AI Agent现状的全面概述,并深入探讨了其应用场景、挑战和未来趋势。对于希望了解AI Agent技术并在实际中部署相关应用的读者来说,具有很高的参考价值。
报告4:Langbase 《2024 State of AI Agents》
Langbase Research《 State of AI Agents》基于3400多位来自100多个国家的开发者的反馈,总结了AI智能体领域的最新趋势。报告描绘了AI技术在2024年的新高峰,以及开发者如何利用不同大型语言模型(LLM)提供商构建AI Agent,并探讨了在工作流程中采用AI Agent所面临的挑战和目标。
研究旨在了解AI Agent在2024年的发展情况,包括开发者如何使用不同的LLM提供商服务,以及在实际应用中遇到的挑战和目标。研究还探讨了AI在不同行业和公司规模中的应用情况,以及开发者对于AI开发平台的偏好。
报告揭示了OpenAI在LLM提供商中占据主导地位,但Google和Anthropic紧随其后;不同LLM提供商在不同行业应用中各有优势。可扩展性复杂性和数据隐私是阻碍AI智能体广泛应用的两大主要因素,而准确性是开发者选择LLM时的首要考虑因素。
报告还指出,自动化和简化是企业采用AI技术的首要目标,软件开发是LLM最主要的应用领域。最后,报告强调了开发者对可定制的AI开发平台和工具的需求,以及对版本控制和SDK生态系统的重视。
对于希望了解AI Agent技术的读者来说,这是一份非常有价值的参考资料,可以帮助大家更好地了解市场动态和技术发展方向。
报告5:Insight Partners 《The state of the AI Agents ecosystem: The tech, use cases, and economics》
这份Insight Partners撰写的报告探讨了AI Agent生态系统的现状、应用案例和经济模式。基于对构建者、企业和研究人员的访谈,分析了AI Agent在企业架构中的实际部署情况,讨论了不同使用案例的复杂性、购买特定功能Agent与构建自定义Agent工作流之间的权衡,以及价值衡量和归属的多样性
报告首先定义了AI Agent,并阐述了其架构设计中的关键考量,特别是人机协同循环和任务规划策略。接着,报告深入分析了AI Agent的参考架构,包括数据检索(RAG、记忆、长上下文)、Agent计算机接口(函数/工具调用、计算机使用、集成)以及性能评估和安全防护(Guardrails)。
报告对AI Agent进行了类型划分,包括垂直Agent、水平Agent平台、多模态Agent和经典SaaS的Agent接口。报告还绘制了AI Agent市场图谱,指出了基础设施和垂直化平台的机遇,并探讨了构建与购买AI Agent的决策考量,以及新兴的定价模式(平台+雇佣Agent、平台+结果导向定价、纯结果导向定价)。
最后,报告总结了企业和构建者在AI Agent部署和发展中面临的挑战和最佳实践,强调了合规性、数据准备、可靠性、ROI衡量、文化融合等重要方面。
报告认为,AI Agent的研究难点在于理解AI Agent的复杂性,包括它们如何独立推理和行动,以及如何将它们集成到现有的企业系统中。研究者需要评估不同使用案例的复杂性,并确定在购买特定功能Agent与构建自定义Agent工作流之间的最佳权衡点。衡量和归属价值的多样性也是一大挑战,因为不同的企业可能有不同的评价标准和业务目标。
这份报告旨在为企业和AI Agent构建者提供对AI Agent生态系统全面而深入的理解,并为其发展战略提供指导。不仅分析了 AI Agent 的技术细节,还深入探讨了企业在部署 AI Agent 时需要考虑的实际问题,并为构建者提供了有价值的建议,推荐仔细研读。
报告6:infoQ《中国 Al Agent应用研究报告》
InfoQ研究中⼼发布的《2024年中国AI Agent应用研究报告》,深入分析了AI Agent在中国的市场发展背景、特征、应用案例以及未来趋势。报告基于技术专利数量、技术发展时间、技术舆论指数等指标,结合市场规模与融资事件等资料,绘制了2024年中国AI Agent应用的成熟度模型,并探讨了AI Agent在不同领域的应用现状与未来发展方向。
报告聚焦2024年第二季度中国AI Agent应用的研究。报告首先分析了AI Agent市场的背景和特征,以及当下中国人工智能的技术成熟度模型,其中特别强调了AI Agent作为连接大模型和应用层的桥梁作用。
报告深入探讨了AI Agent的市场趋势,包括单/多智能体协同发展、通用技术框架、典型应用场景(生活类、企业专业类)以及不同厂商的产品策略(大模型创业厂商、互联网科技厂商、RPA厂商、数字化企业服务商)。还展望了AI Agent未来的发展趋势,例如大模型能力提升、工具生态完善、多智能体协同,以及终端智能体(手机、电脑等)的兴起将带来的变革。
报告指出,AI Agent作为连接模型层与应用层的重要补充,正逐渐深入复杂任务,并在多个行业场景中展现出应用潜力。报告基于技术专利数量、技术发展时间、技术舆论指数等核心指标,结合市场规模与融资事件等公开资料,以及技术和市场专家的验证,绘制了中国人工智能成熟度模型,并对AI Agent的市场特征、应用场景、产品发展、盈利模式等进行了详细探讨。
《2024年中国AI Agent应用研究报告》是一份极具前瞻性和深度的研究报告,对于关注人工智能技术发展、尤其是AI Agent应用的从业者、企业决策者、技术爱好者以及相关领域的研究人员来说,具有很高的参考价值。
报告7:爱分析《2024爱分析·AI Agent 应用实践报告》
《2024爱分析·AI Agent 应用实践报告》由爱分析撰写,旨在探讨AI Agent在企业中的应用现状、市场洞察以及未来发展趋势。
报告首先概述了AI Agent的核心能力——独立思考、自主执行、持续迭代,以及其在市场中的兴起和企业落地的主要挑战:“落地难”和“应用难”。
核心内容聚焦于数据分析AI Agent和AI Agent开发管理平台这两个特定市场,分别分析了其落地实施的关键要点和成功案例,例如城商行利用数据分析AI Agent提升数据分析效率,飞鹤利用AI Agent开发管理平台推进数字化转型。
报告指出,AI Agent作为能够感知环境、基于目标进行决策并执行动作的智能化应用,随着大模型能力的增强和相关技术的成熟,其能力得到了质的飞跃。报告强调了AI Agent在企业中的三个核心能力:独立思考、自主执行、持续迭代,并分析了企业在落地AI Agent项目时面临的挑战。
报告还特别关注了数据分析AI Agent市场和AI Agent开发管理平台市场,提供了市场洞察和案例分析,为企业提供策略指导和实践洞见。
该报告不仅分析了AI Agent的技术和应用,更深入探讨了企业在落地AI Agent时面临的挑战和应对策略。报告强调了企业应从自身特性出发,建立AI Agent与新质生产力、数据要素的内在联系,实现价值升华,并建立AI文化。该报告适合企业决策者、IT负责人以及对AI Agent应用感兴趣的读者阅读。
报告8:头豹研究《2024年中国AI Agent行业研究》
《2024年中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎》报告,由头豹研究院发布,深入分析了AI Agent(人工智能体)在中国的发展现状、应用前景、市场趋势以及行业生态。
报告首先定义了AI Agent,并将其与大模型区分开来,强调其自主决策和执行能力;然后,分析了AI Agent的关键特征、分类及发展历程,并对国内外主流项目及产品进行了盘点;接着,报告探讨了AI Agent的市场规模、驱动因素及行业生态图谱,指出其在企业级应用(toB)方面拥有更广阔的前景;最后,报告对AI Agent在不同行业领域的应用情况及发展趋势进行了深入分析,并对未来发展方向进行了预测,特别指出金融行业是AI Agent应用最成熟的领域,而政务领域则由于数据获取的限制,发展相对滞后。总而言之,该报告旨在为投资者、企业和研究人员提供对中国AI Agent行业全面而深入的了解。
报告指出,AI Agent作为一种能够感知环境、进行决策和执行动作的智能实体,与传统人工智能相比,具备更强的自主性和适应性。详细介绍了AI Agent的定义、基础架构、特征分类、发展历程、市场驱动因素、行业应用图谱、商业模式以及消费级与企业级应用的对比。
还预测了AI Agent在不同行业中的应用发展情况,并提供了国内外AI Agent项目及产品的盘点。整体而言,AI Agent在企业级应用中前景广阔,尤其在金融、电商零售、教育、医疗、制造、交通、媒体娱乐、能源、物流和政务等行业领域中展现出强大的渗透力和应用潜力。
该报告不仅指出了AI Agent在金融等领域的成熟应用,也探讨了其在其他行业的潜力,为对AI Agent技术和市场感兴趣的读者提供了有价值的参考。该报告适合希望了解AI Agent如何落地并引领行业变革的读者阅读。
报告9:Letta 《The AI agents stack 》
《The AI agents stack 》本文探讨了AI Agent栈的最新发展,特别是2024年末的AI Agent生态系统,包括Agents托管/服务、Agents框架和大型语言模型(LLM)模型及存储三个关键层次。报告基于作者在开源AI领域超过一年的工作经验以及7年以上的AI研究经验,对现有的Agents技术栈分类提出质疑,并分享了他们自己的“Agents技术栈”模型。
报告探讨了2024年末AI智能体(Agent)的软件生态系统,并提出了作者自己基于多年经验的“智能体堆栈”模型。
该模型将智能体系统分为三层:底层是大型语言模型(LLM)及其服务和存储,包括各种API服务和向量数据库;中间层是智能体框架,负责LLM调用、状态管理、内存管理以及多智能体通信;顶层是智能体托管和服务,关注如何将智能体部署为服务,并通过REST APIs访问。
报告强调,与简单的LLM聊天机器人相比,智能体开发面临着更大的工程挑战,例如状态管理和工具执行。作者认为,未来的智能体将作为服务部署,并期待出现类似于OpenAI ChatCompletion API的行业标准智能体API。
报告还提到了2022年和2023年兴起的LLM框架和SDK,如LangChain和LlamaIndex,以及通过API消费LLM的标准平台,如vLLM和Ollama。同时,文章也指出了2024年AI领域对“Agents”概念的转变,以及如何从LLM发展到AI Agent的必要性。
这份报告主要面向软件开发者,旨在帮助他们理解 AI Agent 技术栈的复杂性,并为他们提供构建垂直 Agent 应用的指导。报告强调了 AI Agent 与传统 LLM 聊天机器人在工程方面的不同,并介绍了 Letta 提供的相关资源。该报告适合对 AI Agent 技术栈和实际应用感兴趣的开发者阅读。
报告10:德勤《Prompting for action How AI agents are reshaping the future of work》
该报告由德勤(Deloitte)人工智能研究所发布,探讨了AI智能体和多智能体系统如何重塑未来工作。重点介绍了生成式AI(GenAI)的扩展能力和多智能体 AI系统的协同作用,以及这些技术如何影响企业并推动智能组织转型。
报告围绕“随着AI技术的快速发展,企业如何利用AI Agent和多Agent AI系统来重塑业务流程,提高效率并实现自动化”这一问题,展开了详细讨论。
报告指出,AI智能体与传统语言模型不同,具备推理、规划、记忆和行动能力,能自动化工作流程。多智能体系统通过协同合作提高效率、学习能力和准确性,处理复杂任务。例如,在战略洞察方面的应用展示了其在速度、效率和可扩展性方面的优势。还探讨了AI智能体对战略、风险、人才和业务流程的影响,并建议领导者评估用例、制定战略路线图、投资基础设施和人才培养以及加强数据治理和风险管理。
报告提到了当前企业广泛使用的大型语言模型(LLMs)和GenAI工具,这些工具虽然能够根据简单提示生成输出,但其交互通常是事务性的,且作用范围有限。探讨了AI Agent与传统语言模型的不同之处,以及AI Agent如何通过理解上下文、规划工作流程、连接外部工具和数据以及执行动作来实现目标,从而克服了传统AI应用的局限性。
报告认为,如何克服传统AI应用在理解复杂请求、规划工作流程和执行多步骤任务方面的局限性,以及如何整合不同AI Agent以实现更高级别的自动化和优化,是需要关注的重点问题。
总体而言,该报告强调AI Agent和多智能体系统在推动智能化转型方面的潜力,并指出前瞻性的企业和政府机构已经开始部署这些技术,适合对AI Agent的最新进展及其在各行业的实际应用感兴趣的读者阅读。
全文完
王吉伟频道新书《一本书读懂AI Agent:技术、应用与商业》已出版,轻松读懂系统掌握AI Agent技术原理、行业应用、商业价值及创业机会,欢迎大家关注。
【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与AI Agent,欢迎关注与交流。】