論文の概要: Experience Compression Spectrum: Unifying Memory, Skills, and Rules in LLM Agents
- arxiv url: http://arxiv.org/abs/2604.15877v1
- Date: Fri, 17 Apr 2026 09:26:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.861416
- Title: Experience Compression Spectrum: Unifying Memory, Skills, and Rules in LLM Agents
- Title(参考訳): 体験圧縮スペクトル: LLMエージェントにおけるメモリ、スキル、ルールの統合
- Authors: Xing Zhang, Guanghui Wang, Yanwei Cui, Wei Qiu, Ziyuan Li, Bing Zhu, Peiyang He,
- Abstract要約: LLMエージェントは、長期のマルチセッションデプロイメントにスケールし、蓄積したエクスペリエンスを効率的に管理することが重要なボトルネックとなる。
本稿では, メモリ, スキル, ルールを, 圧縮の増大の一軸に沿った点として位置づける統一フレームワークであるEmphExperience Compression Spectrumを提案する。
- 参考スコア(独自算出の注目度): 9.989306175511238
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As LLM agents scale to long-horizon, multi-session deployments, efficiently managing accumulated experience becomes a critical bottleneck. Agent memory systems and agent skill discovery both address this challenge -- extracting reusable knowledge from interaction traces -- yet a citation analysis of 1,136 references across 22 primary papers reveals a cross-community citation rate below 1%. We propose the \emph{Experience Compression Spectrum}, a unifying framework that positions memory, skills, and rules as points along a single axis of increasing compression (5--20$\times$ for episodic memory, 50--500$\times$ for procedural skills, 1,000$\times$+ for declarative rules), directly reducing context consumption, retrieval latency, and compute overhead. Mapping 20+ systems onto this spectrum reveals that every system operates at a fixed, predetermined compression level -- none supports adaptive cross-level compression, a gap we term the \emph{missing diagonal}. We further show that specialization alone is insufficient -- both communities independently solve shared sub-problems without exchanging solutions -- that evaluation methods are tightly coupled to compression levels, that transferability increases with compression at the cost of specificity, and that knowledge lifecycle management remains largely neglected. We articulate open problems and design principles for scalable, full-spectrum agent learning systems.
- Abstract(参考訳): LLMエージェントが長期のマルチセッションデプロイメントにスケールするにつれて、蓄積したエクスペリエンスを効率的に管理することが重要なボトルネックとなる。
エージェントメモリシステムとエージェントスキル発見はどちらも、この課題に対処する -- インタラクショントレースから再利用可能な知識を抽出する -- しかし、22のプライマリ論文にわたる1,136の参照の引用分析は、コミュニティ間の引用レートが1%未満であることを明らかにしている。
我々は,メモリ,スキル,ルールを圧縮増加の単一軸に沿ったポイントとして位置付ける統一フレームワークである‘emph{Experience Compression Spectrum} を提案する。
20以上のシステムをこのスペクトルにマッピングすると、すべてのシステムが固定された所定の圧縮レベルで動作していることが分かる。
さらに, 評価手法が圧縮レベルと密接に結びついていること, 特定のコストで圧縮によって伝達可能性が高くなること, 知識ライフサイクル管理が無視されていること, など, 両コミュニティが独立して, 共有サブプロブレムを解き放つことは, 専門化だけでは不十分であることを示す。
スケーラブルでフルスペクトルのエージェント学習システムのためのオープンな問題と設計原則を明確に述べる。
関連論文リスト
- Unsupervised Behavioral Compression: Learning Low-Dimensional Policy Manifolds through State-Occupancy Matching [42.26405543045843]
アクションベースのポリシー圧縮(APC)は、サンプル非効率であると広く認識されている。
我々は,行動表現を即時的行動マッチングから長期的状態空間カバレッジにシフトさせることにより,APCを向上させるOccupancy-based Policy Compression (OPC)を紹介した。
これらの修正により、生成モデルは真の機能的類似性を取り巻く潜在空間を整理し、幅広い振る舞いを一般化する潜在表現を促進する。
論文 参考訳(メタデータ) (2026-03-27T23:16:27Z) - Unified Spatiotemporal Token Compression for Video-LLMs at Ultra-Low Retention [23.015486635502437]
ビデオ言語モデル(ビデオ-LLM)は、大量の視覚トークンのために高い計算コストに直面している。
グローバルな選択トークンに意味的類似性を重み付けする統一選択機構を提案する。
選択されていないトークンはクラスタリングとリフィルによってマージされ、情報の整合性を保持する。
我々の統合的時間トークン圧縮戦略は,超低トークン保持下での映像理解における最先端技術を確立する。
論文 参考訳(メタデータ) (2026-03-23T13:15:22Z) - Arbitrary Ratio Feature Compression via Next Token Prediction [52.10426317889982]
Arbitrary Ratio Feature Compression (ARFC)フレームワークは、任意の圧縮比を単一のモデルでサポートする。
ARCは、次の回帰予測によって圧縮を行う自動回帰モデルである。
MoSモジュールは複数の圧縮結果を利用して圧縮トークンを洗練する。
ERGCは、圧縮中の意味的および構造的関係を維持するために、トレーニングプロセスに統合される。
論文 参考訳(メタデータ) (2026-02-12T02:38:57Z) - CompilerKV: Risk-Adaptive KV Compression via Offline Experience Compilation [16.540537092341737]
我々は,大規模言語モデルのためのリスク適応型およびヘッドアウェア圧縮フレームワークであるCompilerKVを提案する。
CoherentKVはオフラインエクスペリエンスを、プリフィルのみのデプロイメントのために再利用可能な決定テーブルにコンパイルする。
LongBenchの実験では、CompilerKVが512の予算でSOTAメソッドを支配し、FullKVのパフォーマンスの97.7%を回復し、最大5.2ポイントを達成している。
論文 参考訳(メタデータ) (2026-02-09T14:07:55Z) - PRISM: Performer RS-IMLE for Single-pass Multisensory Imitation Learning [51.24484551729328]
PRISMは,IMLEのバッチ・グロバル・リジェクション・サンプリングに基づく単一パスポリシーである。
PRISMは、Performerアーキテクチャを用いた線形アテンション発生器と時間的マルチセンサエンコーダを結合する。
7-DoFアームD1を搭載したUnitree Go2を用いたロコマニピュレーションやUR5マニピュレータを用いたテーブルトップ操作など,PRISMの有効性を実証する。
論文 参考訳(メタデータ) (2026-02-02T17:57:37Z) - COMI: Coarse-to-fine Context Compression via Marginal Information Gain [28.75695496228666]
大きな言語モデル(LLM)は、様々なタスクにまたがる例外的な機能を示している。
コンテキスト圧縮法は、入力長を大幅に削減し、冗長性をなくすことによってこれらの課題に対処する。
粗粒度適応型文脈圧縮フレームワークCOMIを提案する。
論文 参考訳(メタデータ) (2026-02-02T06:57:22Z) - VisionSelector: End-to-End Learnable Visual Token Compression for Efficient Multimodal LLMs [82.72388893596555]
MLLM(Multimodal Large Language Models)は、計算とメモリのボトルネックに遭遇する。
従来のトークン圧縮技術は、重要な情報を破棄するリスクを負うルールによって制約されることが多い。
我々は,トークン圧縮をエンドツーエンドの学習可能な決定プロセスに再構成する軽量なプラグアンドプレイフレームワークとして,トークン圧縮を再構成する。
論文 参考訳(メタデータ) (2025-10-18T17:54:18Z) - Quantize Once, Train Fast: Allreduce-Compatible Compression with Provable Guarantees [53.950234267704]
我々は、全リデュース勾配互換量子化法であるGlobal-QSGDを紹介する。
ベースライン量子化法で最大3.51%の分散トレーニングを高速化することを示す。
論文 参考訳(メタデータ) (2023-05-29T21:32:15Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Learning, compression, and leakage: Minimising classification error via
meta-universal compression principles [87.054014983402]
学習シナリオのための圧縮技法の有望なグループは、正規化極大(NML)符号化である。
ここでは,教師付き分類問題に対するNMLに基づく意思決定戦略を検討し,多種多様なモデルに適用した場合にPAC学習を実現することを示す。
本手法の誤分類率は,プライバシに敏感なシナリオにおいて,データ漏洩の可能性を定量化するための指標である最大リークによって上限づけられていることを示す。
論文 参考訳(メタデータ) (2020-10-14T20:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。