論文の概要: Worth Remembering: Surprise-Gated Robot Episodic Memory
- arxiv url: http://arxiv.org/abs/2606.03787v2
- Date: Wed, 03 Jun 2026 21:00:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:33.201305
- Title: Worth Remembering: Surprise-Gated Robot Episodic Memory
- Title(参考訳): 心の底から記憶するロボット「Worth」
- Authors: Nicolas Gorlo, Derek K. Wise, Alberto Speranzon, Luca Carlone,
- Abstract要約: 本稿では,V-JEPA-2によって提供されるセマンティックにリッチなデプロイメントに依存しない潜在空間において,サプライズを計算する手法を提案する。
4次元シーングラフに基づく空間記憶を増強するために,我々のゲート型エピソードメモリを用いて,ロボット質問応答における最先端ベンチマークよりも一貫した改善を示す。
- 参考スコア(独自算出の注目度): 12.101245779148316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots solving generalist tasks need to be able to ground instructions in their past experience, since humans may refer to notable past events when giving a task (e.g., ``Take me to where the chemical spill happened yesterday''). Since memory limits make storing all past events infeasible, long-term robot memory must be selective, ideally retaining only those episodes with high utility for future tasks. However, future tasks are not typically given a priori for generalist robots. To select generically useful memories, we propose Bayesian surprise as a gating mechanism for memory formation. We present an approach to compute surprise in a semantically rich deployment-agnostic latent space provided by V-JEPA-2. Using our gated episodic memory to augment 4D scene graph-based spatial memory, we show a consistent improvement over state-of-the-art benchmarks in robot question answering, outperforming prior robot memory methods by $\geq12\%$ for temporal, spatial, and binary questions, and surpassing the performance of supervised and non-causal methods with an unsupervised causal method in event segmentation tasks.
- Abstract(参考訳): 一般論的なタスクを解くロボットは、過去の経験から指示を下す必要がある。
メモリ制限により過去のすべてのイベントを保存できなくなるため、長期的なロボットメモリは選択的であり、理想的には将来のタスクに高いユーティリティを持つこれらのエピソードのみを保持する必要がある。
しかしながら、将来のタスクは一般にジェネラリストロボットの優先順位が与えられない。
汎用的に有用な記憶を選択するため,記憶形成のためのゲーティング機構としてベイズサプライズを提案する。
本稿では,V-JEPA-2によって提供されるセマンティックにリッチなデプロイメントに依存しない潜在空間において,サプライズを計算する手法を提案する。
本研究では,4次元シーングラフに基づく空間記憶の強化を目的として,ロボット問合せにおける最先端のベンチマークに対する一貫した改善,時間的,空間的,二元的質問に対する事前のロボットメモリ手法の$\geq12\%以上の性能向上,イベントセグメンテーションタスクにおける教師なし因果的手法による非因果的手法の性能向上を示す。
関連論文リスト
- RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies [54.23445842621374]
記憶は、長い水平と歴史に依存したロボット操作にとって重要である。
近年,視覚言語アクション(VLA)モデルにメモリ機構が組み込まれ始めている。
本稿では,VLAモデルの評価と進展のための大規模標準ベンチマークであるRoboMMEを紹介する。
論文 参考訳(メタデータ) (2026-03-04T21:59:32Z) - MEM: Multi-Scale Embodied Memory for Vision Language Action Models [73.3883864595845]
本稿では,マルチスケール・エンボダイドメモリ(MEM)について紹介する。
MEMはビデオベースの短水平メモリをビデオエンコーダで圧縮し、テキストベースの長水平メモリと組み合わせている。
MEMは、キッチンを掃除したり、チーズサンドイッチを焼いたりして、最大15分間のタスクをロボットが実行できるようにする。
論文 参考訳(メタデータ) (2026-03-04T00:03:02Z) - MemGen: Weaving Generative Latent Memory for Self-Evolving Agents [57.1835920227202]
本稿では,エージェントに人間的な認知機能を持たせる動的生成記憶フレームワークであるMemGenを提案する。
MemGenは、エージェントが推論を通して潜在記憶をリコールし、増大させ、記憶と認知の密接なサイクルを生み出すことを可能にする。
論文 参考訳(メタデータ) (2025-09-29T12:33:13Z) - MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation [59.31354761628506]
このようなタスクは本質的にマルコフ的ではないが、主流のVLAモデルはそれを見落としているため、ロボット操作には時間的コンテキストが不可欠である。
本稿では,長距離ロボット操作のためのコグニション・メモリ・アクション・フレームワークであるMemoryVLAを提案する。
本稿では,3つのロボットを対象とした150以上のシミュレーションと実世界のタスクについて評価する。
論文 参考訳(メタデータ) (2025-08-26T17:57:16Z) - Semantic HELM: A Human-Readable Memory for Reinforcement Learning [9.746397419479445]
人間の言語における過去の出来事を表現する新しい記憶機構を提案する。
私たちは、部分的に観測可能な環境のセットでメモリメカニズムをトレーニングし、それがメモリコンポーネントを必要とするタスクに優れていることを見つけます。
メモリメカニズムは人間が読めるので、エージェントのメモリを覗き見して、重要な情報が保存されているかどうかを確認することができます。
論文 参考訳(メタデータ) (2023-06-15T17:47:31Z) - Evaluating Long-Term Memory in 3D Mazes [10.224858246626171]
Memory Mazeはエージェントの長期記憶を評価するために設計されたランダム化迷路の3Dドメインである。
既存のベンチマークとは異なり、Memory Mazeはエージェントの能力から切り離された長期的なメモリを測定する。
現在のアルゴリズムは、時間の経過とともに縮小したバックプロパゲーションによるトレーニングの恩恵を受け、小さな迷路で成功するが、大きな迷路での人間のパフォーマンスに欠ける。
論文 参考訳(メタデータ) (2022-10-24T16:32:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。