論文の概要: Long Live the Librarian! A Persistent Search Sub-Agent for Energy-Efficient Multi-Agent Software Engineering Systems
- arxiv url: http://arxiv.org/abs/2605.27787v1
- Date: Wed, 27 May 2026 00:10:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.617409
- Title: Long Live the Librarian! A Persistent Search Sub-Agent for Energy-Efficient Multi-Agent Software Engineering Systems
- Title(参考訳): Long Live the Librarian! エネルギー効率の良いマルチエージェントソフトウェア工学システムのための永続探索サブエージェント
- Authors: Seunghyuk Cho, Sunghyun Choi, Jaeseung Heo, Youngbin Choi, Saemi Moon, MoonJeong Park, Dongwoo Kim,
- Abstract要約: 本稿では,リポジトリ検索履歴を追跡し,エージェント間の冗長な探索動作を抑制する永続的な検索サブエージェントを提案する。
SWE-Bench Verifiedでは、Librarianはタスク性能を維持しながら、既存のマルチエージェントSWEシステムのエピソードあたりのGPUエネルギー消費を最大25%削減する。
- 参考スコア(独自算出の注目度): 11.238528596215877
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS) have substantially advanced autonomous software engineering (SWE), but their growing inference energy demands raise sustainability concerns. In this paper, we demonstrate that this cost is concentrated in an overlooked source: redundant output tokens generated across agents. Two empirical findings ground this claim. First, our per-token energy attribution for MAS reveals a sharp asymmetry: an output token consumes 30 to 1,000 times more energy than an input or cached token. Second, MAS inflate per-episode output because agents repeatedly re-explore overlapping repository regions. To address this inefficiency, we propose Librarian, a persistent search sub-agent that tracks repository-search history and suppresses redundant exploration actions across agents. By returning short references to file regions instead of full file excerpts, Librarian further reduces output-token volume. On SWE-Bench Verified, Librarian reduces per-episode GPU energy consumption of existing multi-agent SWE systems by up to 25% while preserving task performance.
- Abstract(参考訳): マルチエージェントシステム(MAS)は、かなり先進的な自律ソフトウェア工学(SWE)を持っているが、その増大する推論エネルギー需要は持続可能性の懸念を引き起こす。
本稿では,エージェント間で発生する冗長な出力トークンという,見過ごされたソースにこのコストが集中していることを示す。
2つの実証的な発見がこの主張を根拠にしている。
出力トークンは入力またはキャッシュされたトークンの30~1000倍のエネルギーを消費する。
第2に、エージェントが重複するレポジトリ領域を繰り返し再発見するため、MASはエポジショド単位の出力を増大させる。
この非効率性に対処するために,リポジトリ検索履歴を追跡し,エージェント間の冗長な探索動作を抑制する永続的な検索サブエージェントであるLibrarianを提案する。
フルファイルの抜粋の代わりにファイル領域への短い参照を返すことで、Librarianはさらに出力トーケンボリュームを減らす。
SWE-Bench Verifiedでは、Librarianはタスク性能を維持しながら、既存のマルチエージェントSWEシステムのエピソードあたりのGPUエネルギー消費を最大25%削減する。
関連論文リスト
- Elastic-dLLM: Position Preserving Context Compression and Augmentation of Diffusion LLMs [21.48723638711438]
我々は, [MASK]トークンの観点から, dLLMの冗長性を再考する。
位置保存[MASK]トークン圧縮と端末認識拡張を提案する。
論文 参考訳(メタデータ) (2026-05-18T10:09:10Z) - AgentStop: Terminating Local AI Agents Early to Save Energy in Consumer Devices [9.357681245846898]
大規模言語モデル(LLM)は、複雑で多段階的なタスクを自動化するためにますます使われる。
リモートでクラウドベースのエージェントは、プライバシの懸念を高め、ネットワーク接続に依存し、繰り返し発生するAPIコストを発生させる。
我々はAgentStopを紹介した。AgentStopは軽量な効率スーパーバイザで、未成功の軌道を予測し、プリエンプティブに終了する。
論文 参考訳(メタデータ) (2026-05-01T14:45:37Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework [82.66443886385125]
ペーパーサークル(Paper Circle)は、学術文献の発見、評価、整理、理解に必要な労力を減らすために設計された発見・分析システムである。
1)複数のソースからのオフラインおよびオンライン検索を統合するディスカバリパイプライン,多エージェントスコアリング,多様性対応ランキング,構造化アウトプット,2)個々の論文を概念,メソッド,数値などの型付きノードで構造化された知識グラフに変換する分析パイプライン,の2つの補完パイプラインで構成されている。
論文 参考訳(メタデータ) (2026-04-07T17:59:58Z) - Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation [6.4453302264198165]
コード補完のためのリポジトリ表現のための2段階のアプローチである階層埋め込み融合(HEF)を提案する。
HEFはスニペットベースの検索ベースラインに匹敵する正確なマッチング精度を達成する。
グラフベースおよび反復検索システムと比較して、HEFは中央値のエンドツーエンドのレイテンシを13倍から26倍に削減する。
論文 参考訳(メタデータ) (2026-02-04T14:56:11Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - AgentGit: A Version Control Framework for Reliable and Scalable LLM-Powered Multi-Agent Systems [7.408263799616532]
AgentGitはGitライクなロールバックとブランチをマルチエージェントシステム(MAS)にもたらすフレームワークです。
AgentGitは冗長、ランタイム、トークンの使用を著しく削減し、複数のブランチをまたいだ並列探索をサポートしています。
この作業は、より堅牢なMAS設計への実践的なパスを提供し、コラボレーティブAIシステムにおけるエラー回復、安全な探索、計算、A/Bテストを可能にする。
論文 参考訳(メタデータ) (2025-11-01T17:11:31Z) - Automated Benchmark Generation for Repository-Level Coding Tasks [7.305342793164905]
SetUpAgentは、歴史的に正確な依存性の設定、テスト実行、結果解析が可能な完全に自動化されたシステムである。
i)SWEE-Benchは数百のリポジトリを含むSWE-Benchの拡張バージョンで、ii)SWA-Benchはライブラリではなくアプリケーションに焦点を当てたベンチマークです。
論文 参考訳(メタデータ) (2025-03-10T17:42:49Z) - RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective
Augmentation [61.53695868960846]
テキスト内統合に先立って,検索した文書をテキスト要約に圧縮する手法を提案する。
これにより、計算コストを削減できるだけでなく、長期検索された文書の関連情報を識別する上で、LMの負担を軽減できる。
本研究では,あるLMに対して訓練した圧縮機を言語モデリングタスク上で他のLMに転送し,検索した文書にほぼ忠実な要約を提供することを示す。
論文 参考訳(メタデータ) (2023-10-06T17:55:36Z) - Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs [49.71319907864573]
本稿では,分解が容易なマルチエージェントスキル発見法を提案する。
我々のキーとなる考え方は、合同状態空間をクロネッカーグラフとして近似することであり、そのフィドラーベクトルを直接見積もることができる。
ラプラシアンスペクトルを直接計算することは、無限大の状態空間を持つタスクには難易度が高いことを考慮し、さらに本手法の深層学習拡張を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:53:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。