Agentic Reasoning：推理界RAG诞生！牛津大学框架让LLM学会『组队打怪』：动态调用搜索/代码代理，复杂任务准确率飙升50%

2025-02-19 357

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

NLP自然语言处理_基础版，每接口每天50万次

NLP 自学习平台，3个模型定制额度 1个月

NLP自然语言处理_高级版，每接口累计50万次

简介： Agentic Reasoning 是牛津大学推出的增强大型语言模型（LLM）推理能力的框架，通过整合外部工具提升多步骤推理、实时信息检索和复杂逻辑关系组织的能力。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

⚙️ “LLM推理进入模块化时代！深度解读牛津大学Agentic Reasoning框架设计哲学”

大家好，我是蚝油菜花。今天要解剖一个可能改变AI推理范式的开源项目——

Agentic Reasoning 的三大设计原则：

1️⃣ 功能解耦：将工具调用拆分为独立代理（搜索/代码/Mind Map），主模型只做路径决策
2️⃣ 概率驱动：用联合概率模型评估推理路径，自动选择最优解而非暴力穷举
3️⃣ 知识流动：通过NLP流水线实现「检索-分析-组织-验证」的认知闭环

这个框架最精妙之处在于：它让LLM从『答题者』变成了『指挥官』。在生物医药文献分析场景中，研究者用它自动调用PubMed搜索、数据可视化代码和知识图谱构建，原本3天的工作缩短到2小时。现在，让我们从架构图开始逐层剖析...

🚀 快速阅读

Agentic Reasoning 是一个增强 LLM 推理能力的框架，旨在解决复杂的多步骤推理问题。

核心功能：通过动态调用外部代理（如网络搜索、代码执行和结构化记忆），提升推理的效率和准确性。
技术原理：基于动态工具调用机制和迭代推理过程，结合概率生成模型优化推理路径。

Agentic Reasoning 是什么

Agentic Reasoning-cover

Agentic Reasoning 是牛津大学推出的一个增强大型语言模型（LLM）推理能力的框架。它通过整合外部工具（如网络搜索、代码执行和结构化记忆），帮助 LLM 解决复杂的多步骤推理问题。Agentic Reasoning 的核心思想是让 LLM 在推理过程中动态调用外部代理，实时检索信息、执行计算分析和组织复杂逻辑关系。

该框架在博士级科学推理（如 GPQA 数据集）和领域特定的深度研究任务中表现出色，优于现有的检索增强生成（RAG）系统和封闭源 LLM。

Agentic Reasoning 的主要功能

增强多步骤推理能力：基于外部工具（如网络搜索、代码执行和结构化记忆），让 LLM 更高效地处理需要深度研究和多步骤逻辑推导的复杂问题。
实时信息检索与更新：用网络搜索代理实时获取最新信息，确保推理过程中知识的准确性和时效性。
复杂逻辑关系组织：基于 Mind Map 代理构建知识图谱，帮助 LLM 清晰地组织和跟踪推理过程中的逻辑关系，提升演绎推理能力。
计算分析支持：借助代码代理执行编程任务，为需要定量分析的问题提供精确的计算结果。
提升推理效率和准确性：基于任务分配和工具调用，减少主推理模型的负担，避免因处理辅助任务而中断推理链。
专家级知识合成：在深度研究任务中，生成高质量的分析报告，达到甚至超越人类专家的水平。

Agentic Reasoning 的技术原理

动态工具调用机制：在推理过程中，LLM 根据当前推理需求，实时决定是否调用外部工具（如网络搜索或代码执行）。当需要外部信息时，LLM 生成特定的查询请求并嵌入专用标记（如“搜索”或“代码”标记），暂停推理并将请求发送给相应的代理。
外部代理的协同工作：
- Mind Map 代理：将推理链转化为结构化的知识图谱，基于实体识别和语义关系提取，为推理提供逻辑支持。知识图谱能被查询，帮助 LLM 在推理过程中快速获取相关信息。
- 网络搜索代理：从互联网检索与推理上下文相关的文档，基于 LLM 提取关键信息，生成简洁的总结，确保信息的相关性和逻辑连贯性。
- 代码代理：接收 LLM 的代码请求，编写并执行代码，返回结果。避免 LLM 直接生成和执行代码的复杂性，提升推理效率。
迭代推理与知识更新：推理过程是迭代循环，LLM 根据外部代理返回的结果更新推理链，逐步完善逻辑推导，直到得出最终答案。
基于概率的生成模型：推理链和最终答案的生成基于联合概率模型，结合任务指令、查询、工具输出和知识图谱，动态生成连贯的推理过程和准确的答案。
推理优化与验证：基于工具调用频率等指标优化推理过程，选择最佳推理路径，提升推理的准确性和效率。

如何运行 Agentic Reasoning

1. 安装环境

首先，从 environment.yml 文件安装依赖环境：

conda env create -f environment.yml

2. 配置 API 密钥

如果使用远程 LLM 或进行深度研究，需配置相关 API 密钥：

export OPENAI_API_KEY="your openai api key"
export YDC_API_KEY="your you.com api key"
export JINA_API_KEY="your jina api key"
export BING_SUBSCRIPTION_KEY="your bing api key"

3. 运行脚本

运行 Agentic Reasoning 的命令如下：

python scripts/run_agentic_reason.py \
--use_jina True \
--jina_api_key "your jina api key" \
--bing_subscription_key "your bing api key" \
--remote_model "your remote model name, e.g. gpt-4o" \
--mind_map True \ (optional)
--deep_research True \ (optional, if you want to use deep research)