Fugu-MT 論文翻訳(概要): AutoP2C: An LLM-Based Agent Framework for Code Repository Generation from Multimodal Content in Academic Papers

論文の概要: AutoP2C: An LLM-Based Agent Framework for Code Repository Generation from Multimodal Content in Academic Papers

arxiv url: http://arxiv.org/abs/2504.20115v1
Date: Mon, 28 Apr 2025 05:47:37 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-02 19:15:54.604449
Title: AutoP2C: An LLM-Based Agent Framework for Code Repository Generation from Multimodal Content in Academic Papers
Title（参考訳）: AutoP2C: 学術論文におけるマルチモーダルコンテンツからのコードリポジトリ生成のためのLLMベースのエージェントフレームワーク
Authors: Zijie Lin, Yiqing Shen, Qilin Cai, He Sun, Jinrui Zhou, Mingjun Xiao,
Abstract要約: 本稿では,学術出版物のマルチモーダルコンテンツを完全実行可能なコードリポジトリに変換する新しいタスクであるPaper-to-Code' (P2C)を紹介する。研究論文からテキストコンテンツと視覚コンテンツの両方を処理し,完全なコードリポジトリを生成する,大規模言語モデルに基づくマルチエージェントフレームワークであるAutoP2Cを提案する。
参考スコア（独自算出の注目度）: 9.851681616116718
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine Learning (ML) research is spread through academic papers featuring rich multimodal content, including text, diagrams, and tabular results. However, translating these multimodal elements into executable code remains a challenging and time-consuming process that requires substantial ML expertise. We introduce ``Paper-to-Code'' (P2C), a novel task that transforms the multimodal content of scientific publications into fully executable code repositories, which extends beyond the existing formulation of code generation that merely converts textual descriptions into isolated code snippets. To automate the P2C process, we propose AutoP2C, a multi-agent framework based on large language models that processes both textual and visual content from research papers to generate complete code repositories. Specifically, AutoP2C contains four stages: (1) repository blueprint extraction from established codebases, (2) multimodal content parsing that integrates information from text, equations, and figures, (3) hierarchical task decomposition for structured code generation, and (4) iterative feedback-driven debugging to ensure functionality and performance. Evaluation on a benchmark of eight research papers demonstrates the effectiveness of AutoP2C, which can successfully generate executable code repositories for all eight papers, while OpenAI-o1 or DeepSeek-R1 can only produce runnable code for one paper. The code is available at https://github.com/shoushouyu/Automated-Paper-to-Code.
Abstract（参考訳）: 機械学習(ML)の研究は、テキスト、ダイアグラム、表形式の結果を含むリッチなマルチモーダルコンテンツを含む学術論文を通じて広まっている。しかし、これらのマルチモーダル要素を実行可能なコードに変換することは、MLの専門知識を必要とする困難で時間を要するプロセスである。これは、学術出版物のマルチモーダルな内容を、既存のコード生成の定式化を超えて、単にテキスト記述を独立したコードスニペットに変換するという、完全に実行可能なコードリポジトリに変換する新しいタスクである。 P2Cプロセスを自動化するために,研究論文からテキストコンテンツと視覚コンテンツの両方を処理し,完全なコードリポジトリを生成する,大規模言語モデルに基づくマルチエージェントフレームワークAutoP2Cを提案する。具体的には,(1)確立されたコードベースからのリポジトリブループリント抽出,(2)テキスト,方程式,図形からの情報を統合したマルチモーダルコンテンツ解析,(3)構造化コード生成のための階層的タスク分解,(4)機能と性能を確保するための反復的フィードバック駆動デバッグ,の4段階を含む。 OpenAI-o1 や DeepSeek-R1 は1つの論文で実行可能なコードしか生成できないのに対して,8つの研究論文のベンチマークでは,AutoP2C の有効性が示されている。コードはhttps://github.com/shoushouyu/Automated-Paper-to-Codeで入手できる。

関連論文リスト

IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。 IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文参考訳（メタデータ） (2025-07-30T08:08:48Z)
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [57.09163579304332]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。 PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文参考訳（メタデータ） (2025-04-24T01:57:01Z)
ExecRepoBench: Multi-level Executable Code Completion Evaluation [45.963424627710765]
本稿では,リポジトリレベルのベンチマークであるExecRepoBenchの作成を通じて,ソフトウェア開発におけるコード補完を強化する新しいフレームワークを紹介する。本稿では,抽象構文木をベースとした多段階文法ベースの補完手法を提案し,様々な論理単位のコードフラグメントをマスキングする。次に,Repo-Instruct の 7B パラメータでオープンソースの LLM を微調整し,強力なコード補完ベースラインモデル Qwen2.5-Coder-Instruct-C を生成する。
論文参考訳（メタデータ） (2024-12-16T17:14:35Z)
CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。 CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文参考訳（メタデータ） (2024-06-20T16:59:52Z)
R2C2-Coder: Enhancing and Benchmarking Real-world Repository-level Code Completion Abilities of Code Large Language Models [41.080558091097764]
我々は,R2C2-Coderを提案し,大規模言語モデルの実世界のリポジトリレベルのコード補完能力を向上し,ベンチマークする。 R2C2-Coderには、コードプロンプトコンストラクションメソッドR2C2-Enhanceと、よく設計されたベンチマークR2C2-Benchが含まれている。
論文参考訳（メタデータ） (2024-06-03T14:24:29Z)
TransformCode: A Contrastive Learning Framework for Code Embedding via Subtree Transformation [9.477734501499274]
コード埋め込みを対照的な学習方法で学習する新しいフレームワークであるTransformCodeを提案する。我々のフレームワークはエンコーダに依存しない言語に依存しないので、どんなエンコーダモデルでも活用でき、どんなプログラミング言語でも扱える。
論文参考訳（メタデータ） (2023-11-10T09:05:23Z)
Retrieval-Augmented Code Generation for Universal Information Extraction [66.68673051922497]
情報抽出は、自然言語テキストから構造的知識を抽出することを目的としている。本稿では,Large Language Models(LLMs)に基づく汎用検索拡張コード生成フレームワークを提案する。 Code4UIEはPythonクラスを採用し、様々な構造的知識のタスク固有のスキーマを普遍的に定義する。
論文参考訳（メタデータ） (2023-11-06T09:03:21Z)
ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2022-03-15T08:25:08Z)
CodeRetriever: Unimodal and Bimodal Contrastive Learning [128.06072658302165]
関数レベルのコードセマンティック表現を訓練するために,一様および二様のコントラスト学習を組み合わせたCodeRetrieverモデルを提案する。ノンモーダルなコントラスト学習のために、文書と関数名に基づいてポジティブなコードペアを構築するためのセマンティックガイド付き手法を設計する。バイモーダルなコントラスト学習では、コードのドキュメンテーションとインラインコメントを活用して、テキストコードペアを構築します。
論文参考訳（メタデータ） (2022-01-26T10:54:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。