論文の概要: Forget to Improve: On-Device LLM-Agent Continual Learning via Budget-Curated Memory
- arxiv url: http://arxiv.org/abs/2606.25115v1
- Date: Tue, 23 Jun 2026 19:42:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.128164
- Title: Forget to Improve: On-Device LLM-Agent Continual Learning via Budget-Curated Memory
- Title(参考訳): Forget to improvee: On-Device LLM-Agent Continual Learning via Budget-Curated Memory
- Authors: Beining Wu, Zihao Ding, Jun Huang, Yanxiao Zhao,
- Abstract要約: オンデバイス言語モデルエージェントは、重みを更新するよりも、取得したメモリでの経験を蓄積することで改善する。
エージェントのエクスペリエンス・メモリのライフサイクルを管理する1バイト当たりのネット値スコアであるsysを提案する。
- 参考スコア(独自算出の注目度): 7.254575731198877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: On-device language-model agents improve by accumulating experience in retrieved memory rather than by updating weights. This memory is hard-bounded and exposed: it consumes RAM and energy, reaches peers through a thin uplink, and becomes an attack surface because it is writable by what the agent reads. Existing systems each cover one part of this problem: agentic memories grow without a budget, on-device methods keep entries by success alone, and poisoning is studied mainly as an attack rather than as a memory-governance problem. We propose \sys{}, a single net-value-per-byte score that governs an agent's experience-memory lifecycle. The main idea is to let the budget act as the curator: each entry is scored as value minus harm, per byte, so one ruler decides what to keep, share, and trust. \sys{} makes three decisions: (1) \textbf{KEEP} evicts low-value bytes under the RAM and energy budget; (2) \textbf{SHARE} sends an insight only when its value exceeds its uplink cost; and (3) \textbf{TRUST} gates a peer entry by provenance. On language-model-agent task-drift benchmarks and a real heterogeneous Jetson testbed with two robot-arm nodes and a hub, \sys{} reduces memory by $2.7\times$ and uplink by $2.4\times$, drives injection success from 0.75 to zero, and raises accuracy on cases corrupted by poison or stale memory. Curating by net value reduces footprint, energy, uplink, and injection success together without reducing accuracy. In this setting, forgetting by net value improves the agent rather than weakening it.
- Abstract(参考訳): オンデバイス言語モデルエージェントは、重みを更新するよりも、取得したメモリでの経験を蓄積することで改善する。
このメモリはハードバウンドで露出し、RAMとエネルギを消費し、薄いアップリンクを通してピアに到達し、エージェントが読み込むものから安定して攻撃面となる。
既存のシステムはそれぞれこの問題の一部をカバーしている: エージェント記憶は予算なしで成長し、デバイス上のメソッドは単独でエントリを成功させ、中毒は主にメモリ管理の問題としてではなく攻撃として研究される。
本稿では,エージェントのエクスペリエンス・メモリのライフサイクルを管理する1バイト当たりのネット値スコアである‘sys{}’を提案する。
主な考え方は、予算をキュレーターとして振る舞うことである: それぞれのエントリーは、バイト当たりの価値をマイナスにするものとしてスコアされ、1人の支配者が何を保持し、共有し、信頼するかを決める。
1) \textbf{KEEP} は RAM とエネルギー予算の下で低値バイトを排除し、(2) \textbf{SHARE} はその値がアップリンクコストを超える場合にのみ洞察を送り、(3) \textbf{TRUST} は証明によってピアエントリをゲートする。
言語モデル-エージェントタスク-ドリフトベンチマークと、2つのロボットアームノードとハブでテストされた真のヘテロジニアスなJetsonでは、Shasys{}はメモリを2.7\times$とuplinkを2.4\times$に減らし、インジェクションの成功を0.75から0に加速し、毒やストールメモリによって破損したケースの精度を高める。
ネット値による計算は、精度を低下させることなく、フットプリント、エネルギ、アップリンク、インジェクションの成功を減少させる。
この設定では、ネット値による忘れは、それを弱めるのではなく、エージェントを改善する。
関連論文リスト
- Memory as a Wasting Asset: Pricing Flash Endurance for Embodied Agents, and the Limits of Doing So [0.0]
ロボットのフラッシュ持続性は、更新不可能な在庫であるが、消去サイクルに値するメモリの価格が設定されていない。
エンボディメモリは,RAM/オンボードNVM/クラウド階層にまたがるコスト最小化配置を実現するため,単一耐久シャドウ価格の在庫を減価として扱う。
論文 参考訳(メタデータ) (2026-06-16T16:43:19Z) - MemVenom: Triggered Poisoning of Multimodal Memories in Web Agents [74.64265314956441]
そこで我々は,グラフ構造化外部メモリにテキスト画像のコーディネートを施したブラックボックス攻撃フレームワークを提案する。
MemVenomは、GPT-5ファミリーのWebエージェントで最大99.15%に達する、良質なパフォーマンスに最小限の影響を伴って、強力なエンドツーエンド攻撃を成功させる。
論文 参考訳(メタデータ) (2026-06-09T11:53:25Z) - Enhancing Software Engineering Through Closed-Loop Memory Optimization [50.418699819003486]
ソフトウェア工学 (SE) エージェントにおけるメモリ拡張のためのクローズドループフレームワークである ours を紹介する。
タスクに依存しない textbf ベンチマークとアノテーションのない textbf 最適化信号としての有用性を確立する。
その結果、SEエージェントは設定によって常に改善され、成功率で$uparrow5.25%、解決効率で$uparrow4.63%という絶対的なゲインが得られることが示された。
論文 参考訳(メタデータ) (2026-06-04T03:17:21Z) - WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction [72.1620416874118]
マルチモーダルな言語モデルは、長距離エージェントとしてますます多くデプロイされている。
既存のベンチマークは、静的対話上のリコールを測定し、メモリを1つのタスクの精度に分解し、キャプションに対する視覚的な観察を減らす。
マルチモーダルエージェントメモリを,観測可能な4段階ライフサイクルを持つアクションワールドインタラクションループとして定式化する。
論文 参考訳(メタデータ) (2026-05-28T04:27:20Z) - MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection [15.403262505444454]
本稿では,大規模言語モデルエージェントのための時間後因果記憶監査フレームワークを提案する。
MemAuditは、現実的なポストホック監査シナリオ下での攻撃成功率を大幅に削減する。
論文 参考訳(メタデータ) (2026-05-22T15:03:13Z) - PREPING: Building Agent Memory without Tasks [65.75870568959644]
Prepingはプロポーザル誘導型メモリ構築フレームワークである。
コアとなるのは、将来の実践を形作る構造化制御状態であるプロジェクタメモリである。
トライアルでは、Prepingはメモリなしのベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2026-05-11T04:34:43Z) - Remember Me, Refine Me: A Dynamic Procedural Memory Framework for Experience-Driven Agent Evolution [52.76038908826961]
我々は静的ストレージと動的推論のギャップを埋めるため、$textbfReMe$ ($textitRemember Me, Refine Me$)を提案する。
ReMeは3つのメカニズムを通じてメモリライフサイクルを革新する: $textitmulti-faceted distillation$, きめ細かい経験を抽出する。
BFCL-V3とAppWorldの実験では、ReMeが新しい最先端のエージェントメモリシステムを確立している。
論文 参考訳(メタデータ) (2025-12-11T14:40:01Z) - A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory [31.673865459672285]
大規模言語モデル(LLM)エージェントは、過去のインタラクションから学習するためにメモリを使用する。
敵は、エージェントのメモリに一見無害なレコードを注入して、その将来の振る舞いを操作できる。
A-MemGuard は LLM エージェントメモリのための最初のプロアクティブな防御フレームワークである。
論文 参考訳(メタデータ) (2025-09-29T16:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。