論文の概要: CodeDistiller: Automatically Generating Code Libraries for Scientific Coding Agents
- arxiv url: http://arxiv.org/abs/2512.01089v1
- Date: Sun, 30 Nov 2025 21:19:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.575518
- Title: CodeDistiller: Automatically Generating Code Libraries for Scientific Coding Agents
- Title(参考訳): CodeDistiller: 科学的なコーディングエージェントのためのコードライブラリを自動生成する
- Authors: Peter Jansen, Samiah Hassan, Pragnya Narasimha,
- Abstract要約: 自動科学発見(ASD)システムは、コードベースの実験を自動生成し、実行するのに役立つ。
現在のシステムは、少数の手作業による実験例を変異させるか、パラメトリック知識からのみ操作する。
CodeDistillerは、科学的なGithubリポジトリの大量のコレクションを、実際に動作するドメイン固有のコード例の検証済みのライブラリに自動的に蒸留するシステムである。
- 参考スコア(独自算出の注目度): 0.661242140877329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated Scientific Discovery (ASD) systems can help automatically generate and run code-based experiments, but their capabilities are limited by the code they can reliably generate from parametric knowledge alone. As a result, current systems either mutate a small number of manually-crafted experiment examples, or operate solely from parametric knowledge, limiting quality and reach. We introduce CodeDistiller, a system that automatically distills large collections of scientific Github repositories into a vetted library of working domain-specific code examples, allowing ASD agents to expand their capabilities without manual effort. Using a combination of automatic and domain-expert evaluation on 250 materials science repositories, we find the best model is capable of producing functional examples for 74% of repositories, while our downstream evaluation shows an ASD agent augmented with a CodeDistiller generated library produces more accurate, complete, and scientifically sound experiments than an agent with only general materials-science code examples.
- Abstract(参考訳): 自動科学発見(ASD)システムは、コードベースの実験を自動生成し実行するのに役立ちますが、その能力はパラメトリック知識だけで確実に生成できるコードによって制限されます。
結果として、現在のシステムは、少数の手作業による実験例を変異させるか、パラメトリック知識からのみ運用し、品質と到達範囲を制限するかのどちらかである。
CodeDistillerは、科学的なGithubリポジトリの大規模なコレクションを、実際に動作するドメイン固有のコード例の検証済みのライブラリに自動的に蒸留するシステムで、手作業なしでSDエージェントが機能を拡張することができる。
本稿では,250の材料科学レポジトリの自動評価とドメインエキスパート評価を組み合わせることで,リポジトリの74%で機能例を生成できる最高のモデルを見出した。一方,下流評価では,CodeDistiller 生成ライブラリで強化された ASD エージェントは,一般的な材料科学コード例のみを持つエージェントよりも,より正確で完全で科学的に実験できることを示す。
関連論文リスト
- From Reproduction to Replication: Evaluating Research Agents with Progressive Code Masking [48.90371827091671]
AutoExperimentは、AIエージェントの機械学習実験の実装と実行能力を評価するベンチマークである。
我々は最先端のエージェントを評価し、n$が増加するにつれて性能が急速に低下することを発見した。
本研究は、長期コード生成、文脈検索、自律的な実験実行における重要な課題を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-24T15:39:20Z) - Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [70.04746094652653]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。
PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。
次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文 参考訳(メタデータ) (2025-04-24T01:57:01Z) - CodeScientist: End-to-End Semi-Automated Scientific Discovery with Code-based Experimentation [48.12054700748627]
CodeScientistは、遺伝的検索の形式として、アイデアと実験を共同で行う新しいASDシステムである。
我々はこのパラダイムを用いて、エージェントと仮想環境の領域において、機械生成のアイデアを幅広く数百もの自動実験する。
論文 参考訳(メタデータ) (2025-03-20T22:37:17Z) - SWT-Bench: Testing and Validating Real-World Bug-Fixes with Code Agents [10.730852617039451]
ユーザ問題をテストケースに形式化するLLMベースのコードエージェントについて検討する。
我々は人気のあるGitHubリポジトリに基づいた新しいベンチマークを提案し、現実世界の問題、地味なバグフィックス、ゴールデンテストを含む。
コード修復用に設計されたコードエージェントは,テスト生成用に設計されたシステムの性能を上回っている。
論文 参考訳(メタデータ) (2024-06-18T14:54:37Z) - RepoAgent: An LLM-Powered Open-Source Framework for Repository-level
Code Documentation Generation [79.83270415843857]
コードドキュメンテーションを積極的に生成、保守、更新することを目的とした、大規模な言語モデルによるオープンソースフレームワークであるRepoAgentを紹介します。
RepoAgentは高品質なリポジトリレベルのドキュメントを生成するのに優れています。
論文 参考訳(メタデータ) (2024-02-26T15:39:52Z) - CodeAgent: Enhancing Code Generation with Tool-Integrated Agent Systems for Real-World Repo-level Coding Challenges [41.038584732889895]
大規模言語モデル(LLM)は自動コード生成において有望であるが、通常は単純なタスクでのみ優れている。
私たちの研究は、実世界のリポジトリレベルのコード生成という、より現実的な設定でLLMを評価することに向かっています。
我々は,効率的なリポジトリレベルのコード生成に外部ツールを利用する,新しいLLMベースのエージェントフレームワークであるCodeAgentを紹介する。
論文 参考訳(メタデータ) (2024-01-14T18:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。