論文の概要: FastContext: Training Efficient Repository Explorer for Coding Agents
- arxiv url: http://arxiv.org/abs/2606.14066v3
- Date: Thu, 18 Jun 2026 06:02:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.498898
- Title: FastContext: Training Efficient Repository Explorer for Coding Agents
- Title(参考訳): FastContext: コーディングエージェントのための効率的なリポジトリエクスプローラのトレーニング
- Authors: Shaoqiu Zhang, Maoquan Wang, Yuling Shi, Yuhang Wang, Xiaodong Gu, Yongqiang Yao, Tori Gong, Sheng Chen, Rao Fu, Anisha Agarwal, Spandan Grag, Gabriel Ryan, Colin Merkel, Yufan Huang, Shengyu Fu,
- Abstract要約: 大規模言語モデル(LLM)コーディングエージェントは、ソフトウェアエンジニアリングタスクにおいて大きな成果を上げている。
関連するコードを見つけることは、相当量のトークン予算を消費し、関係のないスニペットでエージェントのコンテキストを汚染する。
我々は、リポジトリの探索と解決を分離する専用の探索サブエージェントであるFastContextを紹介します。
- 参考スコア(独自算出の注目度): 29.359764163872473
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Model (LLM) coding agents have achieved strong results on software engineering tasks, yet repository exploration remains a major bottleneck: locating relevant code consumes substantial token budget and pollutes the agent's context with irrelevant snippets. In most agents, the same model explores the repository and solves the task, leaving exploratory reads and searches in the solver's history. We present FastContext, a dedicated exploration subagent that separates repository exploration from solving. Invoked on demand, FastContext issues parallel tool calls and returns concise file paths and line ranges as focused context. FastContext is powered by specialized exploration models spanning 4B--30B parameters. We bootstrap them from strong reference-model trajectories and refine them with task-grounded rewards for broad first-turn search, multi-turn evidence gathering, and precise citation generation. Across SWE-bench Multilingual, SWE-bench Pro, and SWE-QA, integrating FastContext into Mini-SWE-Agent improves end-to-end resolution rates up to 5.5% while reducing coding-agent token consumption up to 60%, with marginal overhead. These results show that repository exploration can be separated from solving and handled effectively by specialized models. Code and data: https://github.com/microsoft/fastcontext
- Abstract(参考訳): 大規模言語モデル(LLM)コーディングエージェントは、ソフトウェアエンジニアリングタスクにおいて大きな成果を上げているが、リポジトリの探索は依然として大きなボトルネックである。
ほとんどのエージェントでは、同じモデルがリポジトリを探索し、そのタスクを解決し、探索的な読み込みと検索はソルバの歴史に残る。
我々は、リポジトリの探索と解決を分離する専用の探索サブエージェントであるFastContextを紹介します。
オンデマンドで呼び出されると、FastContextは並列ツールコールを発行し、フォーカスされたコンテキストとして簡潔なファイルパスと行範囲を返す。
FastContextは、4B--30Bパラメータにまたがる特殊な探索モデルを利用している。
我々は、これらを強力な参照モデル軌道からブートストラップし、広い一ターン探索、多ターンエビデンス収集、正確な引用生成のためのタスクグラウンドの報酬で洗練する。
SWE-bench Multilingual、SWE-bench Pro、SWE-QA全体で、FastContextをMini-SWE-Agentに統合することで、エンドツーエンドの解像度率を最大5.5%改善し、コーディングエージェントトークンの消費量を60%まで削減し、オーバーヘッドを最小に抑える。
これらの結果から,レポジトリ探索を解法から分離し,特殊なモデルで効果的に処理できることが示唆された。
コードとデータ:https://github.com/microsoft/fastcontext
関連論文リスト
- SWE-Explore: Benchmarking How Coding Agents Explore Repositories [20.73123882302075]
SWE-benchのようなリポジトリレベルのコーディングベンチマークは、コーディングエージェントの能力の急激な急上昇を引き起こしている。
本稿では,リポジトリ探索の評価を分離するベンチマークであるSWE-Exploreを紹介する。
論文 参考訳(メタデータ) (2026-06-05T14:08:27Z) - Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - Towards Long-horizon Agentic Multimodal Search [109.0092257657625]
本稿では,LMM-Searcher という,ファイルベースの視覚的表現機構を中心とした新しい多モード深層検索フレームワークを提案する。
エージェントに調整されたフェッチ・イメージ・ツールを装備し、能動的知覚のためのプログレッシブでオンデマンドなビジュアル・ローディング・ストラテジーを実現する。
提案手法は,100ターンの探索地平線へのスケールアップに成功し,オープンソースモデル間の最先端性能を実現した。
論文 参考訳(メタデータ) (2026-04-14T15:40:28Z) - FastCode: Fast and Cost-Efficient Code Understanding and Reasoning [32.264145740214616]
リポジトリスケールのコード推論は、現代のAI支援ソフトウェアエンジニアリングの基盤である。
FastCodeは、コンテンツ消費からリポジトリの探索を分離するフレームワークである。
論文 参考訳(メタデータ) (2026-03-01T09:41:15Z) - Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? [3.2610504259514754]
実世界のタスクにコンテキストファイルが有効かどうかを検討する。
コンテクストファイルはリポジトリのコンテキストを提供しないのに比べてタスクの成功率を低下させる傾向がある。
我々は、コンテキストファイルからの不要な要求はタスクを難しくし、人間によるコンテキストファイルは最小限の要求だけを記述するべきであると結論付けている。
論文 参考訳(メタデータ) (2026-02-12T14:15:22Z) - ContextBench: A Benchmark for Context Retrieval in Coding Agents [26.158308735620405]
コーディングエージェントにおけるコンテキスト検索のプロセス指向評価であるContextBenchを紹介する。
ContextBenchは、8つのプログラミング言語にわたる66のリポジトリから1,136のイシュー解決タスクで構成されている。
論文 参考訳(メタデータ) (2026-02-05T17:10:26Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z) - Resolving Evidence Sparsity: Agentic Context Engineering for Long-Document Understanding [49.26132236798123]
視覚言語モデル(VLM)は、文書理解における主要なアプローチになりつつある。
本稿では,粗いプロセスにおいて,検索者と4つの協調エージェントを編成するマルチエージェントフレームワークSLEUTHを提案する。
このフレームワークは、検索したページ内の重要なテキストおよび視覚的手がかりを特定し、テーブルやチャートなどの健全な視覚的エビデンスをフィルタし、クエリを分析して推論戦略を考案する。
論文 参考訳(メタデータ) (2025-11-28T03:09:40Z) - Emulating Retrieval Augmented Generation via Prompt Engineering for Enhanced Long Context Comprehension in LLMs [23.960451986662996]
本稿では,レトリーバル拡張生成(RAG)を特殊エンジニアリングとチェーンオブ思考推論によりエミュレートする手法を提案する。
我々は,BABILong から選択したタスクに対するアプローチを評価し,大量の散逸テキストを用いた標準 bAbI QA 問題をインターリーブする。
論文 参考訳(メタデータ) (2025-02-18T02:49:40Z) - On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文 参考訳(メタデータ) (2024-06-06T19:44:17Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。