論文の概要: BootstrapAgent: Distilling Repository Setup into Reusable Agent Knowledge
- arxiv url: http://arxiv.org/abs/2605.15815v1
- Date: Fri, 15 May 2026 10:09:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.250434
- Title: BootstrapAgent: Distilling Repository Setup into Reusable Agent Knowledge
- Title(参考訳): BootstrapAgent: リポジトリのセットアップを再利用可能なエージェント知識に拡張する
- Authors: Sihan Fu, Oucheng Liu, Shiyuan Wang, Jin Shi, Chengkun Wei,
- Abstract要約: リポジトリを使用可能な開発状態にブートストラップするには、相当な試行錯誤調査が必要である。
BootstrapAgentは、ブートストラップ探索中に発見されたブートストラップを、永続的で検証可能なエージェント消費可能な.bootstrapコントラクトに蒸留するフレームワークである。
BootstrapAgentは92.9%の成功率を記録し、ベースラインを10%以上上回り、ダウンストリームエージェントトークンの使用量を25.9%削減し、ビルド時間を22.3%削減した。
- 参考スコア(独自算出の注目度): 12.595470521441408
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code agents increasingly help developers work with unfamiliar repositories, but every such task depends on a costly prerequisite: bootstrapping the repository into a usable development state. This process requires substantial trial-and-error exploration, yet the resulting knowledge--resolved dependencies, repair strategies--stays trapped in a single conversation, unavailable to future agents. We therefore formulate repository bootstrapping as a reusable startup knowledge problem and introduce BootstrapAgent, a multi-agent framework that distills the heuristics discovered during bootstrap exploration into a persistent, verifiable, agent-consumable .bootstrap contract. Through evidence extraction, structured planning, deterministic Docker-based verification, and trace-driven repair, BootstrapAgent generates a contract covering environment setup, diagnostic checks, minimal verification, and accumulated repair knowledge. We further propose warm repair with clean replay to accelerate iterative debugging without sacrificing cold-start reproducibility, and a delta repair with sanity check to prevent reward hacking. Experiments on three benchmarks show that BootstrapAgent achieves a 92.9% success rate, outperforming the baseline by over 10% while reducing downstream agent token usage by 25.9% and build time by 22.3%. Our code is available at https://github.com/Vossera/BootstrapAgent.
- Abstract(参考訳): コードエージェントは、開発者が不慣れなリポジトリで作業するのをますます助けるが、そのようなタスクはすべて、コストのかかる前提条件に依存している:リポジトリを使用可能な開発状態にブートストラップする。
このプロセスには、大規模なトライアルとエラーの探索が必要ですが、結果として生じる知識 - 依存関係の解決、修正戦略 -- は、単一の会話に閉じ込められ、将来のエージェントには利用できないものなのです。
したがって、再利用可能なスタートアップ知識問題としてリポジトリブートストラップを定式化し、ブートストラップ探索中に発見されたヒューリスティックを永続的で検証可能なエージェント消費可能な.NETに蒸留するマルチエージェントフレームワークであるBootstrapAgentを紹介します。
ブートストラップ契約
エビデンス抽出、構造化計画、決定論的Dockerベースの検証、トレース駆動の修復を通じて、BootstrapAgentは、環境設定、診断チェック、最小限の検証、蓄積された修理知識をカバーしたコントラクトを生成する。
また,冷間開始再現性を犠牲にすることなく反復的デバッグを高速化するためのクリーンリプレイによる暖房修復と,報奨ハッキングを防止するための正当性チェックによるデルタ修復を提案する。
3つのベンチマークの実験では、BootstrapAgentが92.9%の成功率を記録し、ベースラインを10%以上上回り、ダウンストリームエージェントトークンの使用量を25.9%、ビルド時間を22.3%削減した。
私たちのコードはhttps://github.com/Vossera/BootstrapAgent.comで公開されています。
関連論文リスト
- BUILD-AND-FIND: An Effort-Aware Protocol for Evaluating Agent-Managed Codebases [0.0]
BUILD-AND-FINDは、下流エージェントが生成されたリポジトリから意図した選択を復元できるかどうかを評価するプロトコルである。
各タスクに対して、ビルダーは隠されたリポジトリの仕様を見て、仕様に書かれた複数選択の質問バンクを作成します。
このプロトコルは、行動の正しさをアーティファクト側のリカバリから切り離し、リカバリの正確性、再現性、実装のカバレッジ、検査の労力を報告します。
論文 参考訳(メタデータ) (2026-05-07T12:35:27Z) - HAFixAgent: History-Aware Automated Program Repair Agent [13.82629698836299]
HAFixAgentはHAFixAgentというヒストリー対応のバグフィクスエージェントで,その修復ループに非難由来のリポジトリを注入する。
Defects4Jの854の実際のバグに関する予備的な研究は、我々の設計を動機付け、バグ関連の歴史が広く利用でき、非常に集中していることを示している。
論文 参考訳(メタデータ) (2025-11-02T18:45:34Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。
1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文 参考訳(メタデータ) (2024-04-26T04:55:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。