論文の概要: Reducing Token Usage of State-in-Context Agents using Minification
- arxiv url: http://arxiv.org/abs/2606.01326v1
- Date: Sun, 31 May 2026 16:24:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.588802
- Title: Reducing Token Usage of State-in-Context Agents using Minification
- Title(参考訳): 最小化によるステート・イン・コンテクストエージェントのトークン使用量削減
- Authors: Nicolas Hrubec, Jürgen Cito,
- Abstract要約: GPT-5-mini を用いて終末から終末までの全ベンチマークを行い,GPT-4.1 で選択されたアブレーションを施行した。
プログラムのセマンティクスを保ちながら、非意味の語彙要素を削除または短縮する一連のコード最小化手法を適用する。
実験により、最小化により平均入力トークン使用率が42%減少し、12ポイントの解像度が低下することが示された。
- 参考スコア(独自算出の注目度): 1.3124479769761592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a replication and extension of the recently introduced state-in-context agent framework. We independently re-implement the DirectSolve variant and evaluate it on the SWE-bench Verified benchmark. We report end-to-end full-benchmark results using GPT-5-mini and run selected ablations with GPT-4.1. In addition, we investigate a complementary research question: What is the impact of token-reducing input transformation strategies on the performance of software engineering agents? Based on a preliminary prompt analysis, we identify source code as the dominant contributor to token consumption. We therefore apply a series of code minification techniques that remove or shorten non-essential lexical elements while preserving program semantics. The proposed transformations are integrated into the agent and systematically evaluated. Experiments show that minification reduces average input token usage by 42% with a 12 percentage-point drop in resolution rate. These findings demonstrate that lightweight source code transformations can yield substantial efficiency gains while retaining a substantial fraction of the baseline performance, indicating a promising path toward more cost-effective agents. The full implementation is publicly available on GitHub: https://github.com/ipa-lab/minified-state-in-context-agent
- Abstract(参考訳): 本稿では、最近導入されたステート・イン・コンテクスト・エージェント・フレームワークのレプリケーションと拡張について述べる。
我々はDirectSolveの変種を独立に再実装し、SWE-bench Verifiedベンチマークで評価する。
GPT-5-mini を用いて終末から終末までの全ベンチマークを行い,GPT-4.1 で選択されたアブレーションを施行した。
さらに, トークン還元型入力変換戦略がソフトウェア工学エージェントの性能に与える影響について, 相補的な研究課題について検討する。
予備的なプロンプト分析に基づいて、ソースコードをトークン消費の主要因とみなす。
そこで我々は,プログラムのセマンティクスを保ちながら,非意味的語彙要素を削除あるいは短縮する一連のコード最小化手法を適用した。
提案した変換はエージェントに統合され、体系的に評価される。
実験により、最小化により平均入力トークン使用率が42%減少し、12ポイントの解像度が低下することが示された。
これらの結果から,ライトウェイトなソースコード変換がベースライン性能のかなりの部分を維持しつつ,大幅な効率向上をもたらすことが示され,よりコスト効率の高いエージェントへの道のりが示唆された。
完全な実装はGitHubで公開されている。 https://github.com/ipa-lab/minified-state-in-context-agent。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Agentic Test-Time Scaling for WebAgents [65.5178428849495]
CATTS(Confidence-Aware Test-Time Scaling)を提案する。
CATTSは、WebArena-LiteとGoBrowseのパフォーマンスをReact上で最大9.1%改善し、均一なスケーリングよりも最大2.3倍少ないトークンを使用する。
論文 参考訳(メタデータ) (2026-02-12T18:58:30Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - The Complexity Trap: Simple Observation Masking Is as Efficient as LLM Summarization for Agent Context Management [2.582081036460148]
LLM(Large Language Model)ベースのエージェントは、反復的推論、探索、ツール使用によって複雑なタスクを解決する。
本稿では,SWE-bench Verified上でのSWE-agentにおけるこれらのアプローチの体系的比較について述べる。
簡易な環境監視マスキング戦略は,LLM要約の解解率をわずかに上回りながら,原材料と比較してコストを半減することがわかった。
論文 参考訳(メタデータ) (2025-08-29T09:02:35Z) - Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文 参考訳(メタデータ) (2025-05-23T08:23:36Z) - ConSol: Sequential Probability Ratio Testing to Find Consistent LLM Reasoning Paths Efficiently [3.6393221632527686]
小言語モデル(LLM)は、回答を提供する前に中間推論ステップを生成することで複雑なタスクを解決する。
広く使われている自己整合性法は、精度を向上させるために複数の推論経路を集約することにより、これらのコストをさらに高める。
十分な整合性が達成できればサンプリングを動的に停止するために,逐次確率比検定(SPRT)を活用することを提案する。
論文 参考訳(メタデータ) (2025-03-22T00:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。