論文の概要: Chameleon: Episodic Memory for Long-Horizon Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2603.24576v1
- Date: Wed, 25 Mar 2026 17:52:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.424125
- Title: Chameleon: Episodic Memory for Long-Horizon Robotic Manipulation
- Title(参考訳): Chameleon: 長軸ロボットマニピュレーションのためのエピソードメモリ
- Authors: Xinying Guo, Chenxi Jiang, Hyun Bin Kim, Ying Sun, Yang Xiao, Yuhang Han, Jianfei Yang,
- Abstract要約: ほとんどのエンボディエージェントは、意味的に圧縮されたトレースと類似性に基づく検索を通じてメモリを実装している。
本稿では,不明瞭な文脈を保存するために,幾何学的背景を持つマルチモーダルトークンを記述するChameleonを提案する。
また,感性エイリアス下でのエピソードリコール,空間追跡,シーケンシャルな操作にまたがる実ロボットUR5eデータセットであるCamo-Datasetを紹介する。
- 参考スコア(独自算出の注目度): 24.06431936695819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic manipulation often requires memory: occlusion and state changes can make decision-time observations perceptually aliased, making action selection non-Markovian at the observation level because the same observation may arise from different interaction histories. Most embodied agents implement memory via semantically compressed traces and similarity-based retrieval, which discards disambiguating fine-grained perceptual cues and can return perceptually similar but decision-irrelevant episodes. Inspired by human episodic memory, we propose Chameleon, which writes geometry-grounded multimodal tokens to preserve disambiguating context and produces goal-directed recall through a differentiable memory stack. We also introduce Camo-Dataset, a real-robot UR5e dataset spanning episodic recall, spatial tracking, and sequential manipulation under perceptual aliasing. Across tasks, Chameleon consistently improves decision reliability and long-horizon control over strong baselines in perceptually confusable settings.
- Abstract(参考訳): 隠蔽と状態変化は、知覚的な観察を許容し、異なる相互作用履歴から同じ観察が生じる可能性があるため、観察レベルでの行動選択をマルコフ的でないものにすることができる。
ほとんどのエンボディードエージェントは、意味的に圧縮されたトレースと類似性に基づく検索を通じてメモリを実装している。
人間のエピソードメモリにインスパイアされたChameleonは、不明瞭なコンテキストを保存し、差別化可能なメモリスタックを通じてゴール指向リコールを生成するために、ジオメティックグラウンドのマルチモーダルトークンを記述する。
また,感性エイリアス下でのエピソードリコール,空間追跡,シーケンシャルな操作にまたがる実ロボットUR5eデータセットであるCamo-Datasetを紹介する。
タスク全体にわたって、Chameleonは決定の信頼性を一貫して改善し、知覚的に不確実な設定において強力なベースラインを長時間にわたって制御する。
関連論文リスト
- Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies [54.23445842621374]
記憶は、長い水平と歴史に依存したロボット操作にとって重要である。
近年,視覚言語アクション(VLA)モデルにメモリ機構が組み込まれ始めている。
本稿では,VLAモデルの評価と進展のための大規模標準ベンチマークであるRoboMMEを紹介する。
論文 参考訳(メタデータ) (2026-03-04T21:59:32Z) - RMBench: Memory-Dependent Robotic Manipulation Benchmark with Insights into Policy Design [77.30163153176954]
RMBenchは、メモリの複雑さの複数のレベルにまたがる9つの操作タスクからなるシミュレーションベンチマークである。
Mem-0は、制御アブレーション研究をサポートするために設計された明示的なメモリコンポーネントを備えたモジュラー操作ポリシーである。
既存のポリシにおけるメモリ関連の制限を特定し、アーキテクチャ設計の選択がメモリパフォーマンスに与える影響に関する実証的な洞察を提供する。
論文 参考訳(メタデータ) (2026-03-01T18:59:59Z) - CloneMem: Benchmarking Long-Term Memory for AI Clones [16.784751074924568]
AIクローンは、個人の思考や行動をシミュレートして、長期的なパーソナライズされた対話を可能にすることを目的としている。
我々は,非会話的デジタルトレースに基づくAIクローンシナリオの長期メモリ評価ベンチマークであるCloneMemを紹介する。
論文 参考訳(メタデータ) (2026-01-11T18:33:12Z) - Memory Matters More: Event-Centric Memory as a Logic Map for Agent Searching and Reasoning [55.251697395358285]
大規模言語モデル(LLM)は、環境を推論し、計画し、相互作用するインテリジェントエージェントとして、ますます多くデプロイされている。
長期のシナリオに効果的にスケールするには、そのようなエージェントの重要な機能は、過去の経験を保持し、整理し、取り出すことができるメモリメカニズムである。
イベント理論にインスパイアされたイベント中心のメモリフレームワークであるCompassMemを提案する。
論文 参考訳(メタデータ) (2026-01-08T08:44:07Z) - MemoryVLA: Perceptual-Cognitive Memory in Vision-Language-Action Models for Robotic Manipulation [59.31354761628506]
このようなタスクは本質的にマルコフ的ではないが、主流のVLAモデルはそれを見落としているため、ロボット操作には時間的コンテキストが不可欠である。
本稿では,長距離ロボット操作のためのコグニション・メモリ・アクション・フレームワークであるMemoryVLAを提案する。
本稿では,3つのロボットを対象とした150以上のシミュレーションと実世界のタスクについて評価する。
論文 参考訳(メタデータ) (2025-08-26T17:57:16Z) - Spatially-Aware Transformer for Embodied Agents [20.498778205143477]
本稿では,空間情報を含む空間認識変換器モデルの利用について検討する。
メモリ利用効率が向上し,様々な場所中心の下流タスクにおいて精度が向上することが実証された。
また,強化学習に基づくメモリ管理手法であるAdaptive Memory Allocatorを提案する。
論文 参考訳(メタデータ) (2024-02-23T07:46:30Z) - Memoria: Resolving Fateful Forgetting Problem through Human-Inspired Memory Architecture [5.9360953869782325]
本稿では,人工ニューラルネットワークのメモリシステムであるMemoriaを紹介する。
その結果, 分類, 言語モデリング, 分類の多様なタスクにおいて, Memoriaの有効性が証明された。
エングラム分析により、記憶は人間の記憶の特徴である優位性、傾向、時間的連続効果を示すことが明らかとなった。
論文 参考訳(メタデータ) (2023-10-04T09:40:46Z) - HM4: Hidden Markov Model with Memory Management for Visual Place
Recognition [54.051025148533554]
自律運転における視覚的位置認識のための隠れマルコフモデルを提案する。
我々のアルゴリズムはHM$4$と呼ばれ、時間的ルックアヘッドを利用して、有望な候補画像をパッシブストレージとアクティブメモリ間で転送する。
固定被覆領域に対して一定の時間と空間推定が可能であることを示す。
論文 参考訳(メタデータ) (2020-11-01T08:49:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。