論文の概要: Gated Memory Policy
- arxiv url: http://arxiv.org/abs/2604.18933v1
- Date: Tue, 21 Apr 2026 00:14:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.54749
- Title: Gated Memory Policy
- Title(参考訳): Gated Memory Policy
- Authors: Yihuai Gao, Jinyun Liu, Shuang Li, Shuran Song,
- Abstract要約: ゲーテッドメモリポリシー(GMP)は、いつメモリをリコールするか、何をリコールするかを学習する。
GMPは学習メモリゲート機構を採用し、必要に応じて履歴コンテキストを選択的に活性化する。
GMPは、長い歴史のベースラインよりも平均的な成功率を30.1%向上させる。
- 参考スコア(独自算出の注目度): 19.090972728871332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic manipulation tasks exhibit varying memory requirements, ranging from Markovian tasks that require no memory to non-Markovian tasks that depend on historical information spanning single or multiple interaction trials. Surprisingly, simply extending observation histories of a visuomotor policy often leads to a significant performance drop due to distribution shift and overfitting. To address these issues, we propose Gated Memory Policy (GMP), a visuomotor policy that learns both when to recall memory and what to recall. To learn when to recall memory, GMP employs a learned memory gate mechanism that selectively activates history context only when necessary, improving robustness and reactivity. To learn what to recall efficiently, GMP introduces a lightweight cross-attention module that constructs effective latent memory representations. To further enhance robustness, GMP injects diffusion noise into historical actions, mitigating sensitivity to noisy or inaccurate histories during both training and inference. On our proposed non-Markovian benchmark MemMimic, GMP achieves a 30.1% average success rate improvement over long-history baselines, while maintaining competitive performance on Markovian tasks in RoboMimic. All code, data and in-the-wild deployment instructions are available on our project website https://gated-memory-policy.github.io/.
- Abstract(参考訳): ロボット操作タスクは、メモリを必要としないマルコフのタスクから、単一のまたは複数のインタラクショントライアルにまたがる履歴情報に依存する非マルコフのタスクまで、様々なメモリ要件を示す。
驚いたことに、ビジュモータ政策の観察履歴を単に伸ばすだけで、分布シフトや過度な適合によって、大きなパフォーマンス低下につながることがしばしばある。
これらの問題に対処するために,記憶の記憶と記憶の記憶の両方を学ぶビジュモータポリシーであるGed Memory Policy (GMP)を提案する。
メモリをいつリコールするかを学習するために、GMPは学習したメモリゲート機構を使用し、必要に応じて履歴コンテキストを選択的に活性化し、堅牢性と反応性を向上させる。
効率的にリコールする方法を学ぶために、GMPは効果的な潜在メモリ表現を構築する軽量なクロスアテンションモジュールを導入した。
強靭性を高めるため、GMPは歴史的行動に拡散ノイズを注入し、トレーニングと推論の間にノイズや不正確な履歴に対する感受性を緩和する。
提案した非マルコフ的ベンチマークであるMemMimicでは、GMPは、ロボミミックにおけるマルコフ的タスクの競合性能を維持しながら、長い歴史ベースラインよりも平均的な成功率を30.1%向上させる。
すべてのコード、データ、配置手順はプロジェクトのWebサイトhttps://gated-Memory-policy.github.io/.com/で公開されています。
関連論文リスト
- MemoAct: Atkinson-Shiffrin-Inspired Memory-Augmented Visuomotor Policy for Robotic Manipulation [6.490934654648497]
MemoActは階層的なメモリベースのポリシーであり、特定のボトルネックに対処するために異なるメモリ層を利用する。
MemoActは、既存のMarkovianベースラインと履歴対応ポリシーの両方と比較して、優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-19T05:02:43Z) - VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory [31.464584758455356]
VPWEMは、ワーキングメモリとエピソードメモリを備えた非マルコフヴィジュモータ政策である。
動作生成には短期情報とエピソードワイド情報の両方を使用し、1ステップあたりのメモリと計算がほぼ一定である。
論文 参考訳(メタデータ) (2026-03-05T07:52:50Z) - RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies [54.23445842621374]
記憶は、長い水平と歴史に依存したロボット操作にとって重要である。
近年,視覚言語アクション(VLA)モデルにメモリ機構が組み込まれ始めている。
本稿では,VLAモデルの評価と進展のための大規模標準ベンチマークであるRoboMMEを紹介する。
論文 参考訳(メタデータ) (2026-03-04T21:59:32Z) - RMBench: Memory-Dependent Robotic Manipulation Benchmark with Insights into Policy Design [77.30163153176954]
RMBenchは、メモリの複雑さの複数のレベルにまたがる9つの操作タスクからなるシミュレーションベンチマークである。
Mem-0は、制御アブレーション研究をサポートするために設計された明示的なメモリコンポーネントを備えたモジュラー操作ポリシーである。
既存のポリシにおけるメモリ関連の制限を特定し、アーキテクチャ設計の選択がメモリパフォーマンスに与える影響に関する実証的な洞察を提供する。
論文 参考訳(メタデータ) (2026-03-01T18:59:59Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文 参考訳(メタデータ) (2026-01-05T08:24:16Z) - Multiple Memory Systems for Enhancing the Long-term Memory of Agent [9.43633399280987]
MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。
我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文 参考訳(メタデータ) (2025-08-21T06:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。