論文の概要: Training Versatile Coding Agents in Synthetic Environments
- arxiv url: http://arxiv.org/abs/2512.12216v1
- Date: Sat, 13 Dec 2025 07:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.167994
- Title: Training Versatile Coding Agents in Synthetic Environments
- Title(参考訳): 合成環境における揮発性符号化剤の訓練
- Authors: Yiqi Zhu, Apurva Gandhi, Graham Neubig,
- Abstract要約: 環境と軌道を生成する新しいパイプラインであるSWE-Playgroundを紹介する。
SWE-Playgroundは、強力な言語モデルとエージェントでゼロからプロジェクトとタスクを合成する。
これにより、ユニットテストを生成したり、スクラッチからライブラリを実装することで、問題の再現など、より広範なコーディングタスクに取り組むことができます。
- 参考スコア(独自算出の注目度): 44.5849223659282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prior works on training software engineering agents have explored utilizing existing resources such as issues on GitHub repositories to construct software engineering tasks and corresponding test suites. These approaches face two key limitations: (1) their reliance on pre-existing GitHub repositories offers limited flexibility, and (2) their primary focus on issue resolution tasks restricts their applicability to the much wider variety of tasks a software engineer must handle. To overcome these challenges, we introduce SWE-Playground, a novel pipeline for generating environments and trajectories which supports the training of versatile coding agents. Unlike prior efforts, SWE-Playground synthetically generates projects and tasks from scratch with strong language models and agents, eliminating reliance on external data sources. This allows us to tackle a much wider variety of coding tasks, such as reproducing issues by generating unit tests and implementing libraries from scratch. We demonstrate the effectiveness of this approach on three distinct benchmarks, and results indicate that SWE-Playground produces trajectories with dense training signal, enabling agents to reach comparable performance with significantly fewer trajectories than previous works.
- Abstract(参考訳): これまで、ソフトウェアエンジニアリングエージェントのトレーニングでは、GitHubリポジトリのイシューなどの既存のリソースを活用して、ソフトウェアエンジニアリングタスクとそれに対応するテストスイートを構築してきた。
1) 既存のGitHubリポジトリへの依存は柔軟性に制限を与え、(2) 問題解決タスクに主眼を置いているため、ソフトウェアエンジニアが扱わなければならない幅広いタスクへの適用が制限される。
これらの課題を克服するために,多様なコーディングエージェントのトレーニングを支援する環境と軌道を生成する新しいパイプラインであるSWE-Playgroundを紹介した。
以前の取り組みとは異なり、SWE-Playgroundは強力な言語モデルとエージェントでゼロからプロジェクトとタスクを合成し、外部データソースへの依存をなくした。
これにより、ユニットテストを生成したり、スクラッチからライブラリを実装することで、問題の再現など、より広範なコーディングタスクに取り組むことができます。
提案手法の有効性を3つの異なるベンチマークで検証し,SWE-Playground が高密度な学習信号でトラジェクトリを生成することを示す。
関連論文リスト
- Reinforcement Learning for Machine Learning Engineering Agents [52.03168614623642]
強化学習によって改善される弱いモデルによって支援されるエージェントは、はるかに大きいが静的モデルによって支援されるエージェントよりも優れていることを示す。
分散非同期RLフレームワークにおいて,高コストかつ高利回りな動作を増幅するための時間依存性の勾配更新を提案する。
また,早期に失敗するプログラムとほぼ正しくないプログラムを区別し,部分クレジットを提供する環境機器を提案する。
論文 参考訳(メタデータ) (2025-09-01T18:04:10Z) - InternBootcamp Technical Report: Boosting LLM Reasoning with Verifiable Task Scaling [71.37579508777843]
大規模言語モデル(LLM)は、複雑な推論機能を実現することによって、人工知能に革命をもたらした。
このギャップに対処するため、1000以上のドメイン分散タスク環境からなるオープンソースのフレームワークであるInternBootcampを紹介します。
論文 参考訳(メタデータ) (2025-08-12T05:00:00Z) - A Survey on Code Generation with LLM-based Agents [61.474191493322415]
大規模言語モデル(LLM)を利用したコード生成エージェントは、ソフトウェア開発パラダイムに革命をもたらしている。
LLMは3つのコア特徴によって特徴づけられる。
本稿では,LLMに基づくコード生成エージェントの分野を体系的に調査する。
論文 参考訳(メタデータ) (2025-07-31T18:17:36Z) - SWE-rebench: An Automated Pipeline for Task Collection and Decontaminated Evaluation of Software Engineering Agents [31.921127664873882]
LLMベースのエージェントは、SWE(Software Engineering)タスクの増加に期待できる能力を示している。
高品質なトレーニングデータは、特に現実世界のSWEシナリオを反映したデータが少ない。
既存のデータセットはワンショットのコード生成に限られるか、小さな手作業による対話的なタスクのコレクションで構成されている。
論文 参考訳(メタデータ) (2025-05-26T18:01:00Z) - Spatial Reasoning and Planning for Deep Embodied Agents [2.7195102129095003]
この論文は空間的推論と計画タスクのためのデータ駆動手法の開発を探求する。
学習効率、解釈可能性、新しいシナリオ間の伝達可能性の向上に重点を置いている。
論文 参考訳(メタデータ) (2024-09-28T23:05:56Z) - Environment Generation for Zero-Shot Compositional Reinforcement
Learning [105.35258025210862]
環境構成設計(CoDE)は、ジェネレータエージェントを訓練し、エージェントの現在のスキルレベルに合わせて一連の構成タスクを自動的に構築する。
我々は,複数のページや部屋からなる環境を生成することを学び,それらの環境において複雑なタスクを広範囲にこなせるRLエージェントを訓練する。
CoDEは最強のベースラインよりも4倍高い成功率を示し、3500のプリミティブタスクで学んだ実際のWebサイトのパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-01-21T21:35:01Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。