論文の概要: Resolving State Ambiguity in Robot Manipulation via Adaptive Working Memory Recoding
- arxiv url: http://arxiv.org/abs/2512.24638v1
- Date: Wed, 31 Dec 2025 05:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.583274
- Title: Resolving State Ambiguity in Robot Manipulation via Adaptive Working Memory Recoding
- Title(参考訳): 適応的ワーキングメモリ再符号化によるロボットマニピュレーションにおける状態の曖昧さの解消
- Authors: Qingda Hu, Ziheng Qiu, Zijun Xu, Kaizhao Zhang, Xizhou Bu, Zuolei Sun, Bo Zhang, Jieru Zhao, Zhongxue Gan, Wenchao Ding,
- Abstract要約: PAMはアダプティブ・ワーキング・メモリを備えた新しいビズモータ・ポリシーである。
300フレームの履歴ウィンドウをサポートし、高い推論速度を維持している。
我々は、7つのタスクを慎重に設計し、PAMが複数の状態曖昧性のシナリオを同時に処理できることを検証する。
- 参考スコア(独自算出の注目度): 12.400431805327093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State ambiguity is common in robotic manipulation. Identical observations may correspond to multiple valid behavior trajectories. The visuomotor policy must correctly extract the appropriate types and levels of information from the history to identify the current task phase. However, naively extending the history window is computationally expensive and may cause severe overfitting. Inspired by the continuous nature of human reasoning and the recoding of working memory, we introduce PAM, a novel visuomotor Policy equipped with Adaptive working Memory. With minimal additional training cost in a two-stage manner, PAM supports a 300-frame history window while maintaining high inference speed. Specifically, a hierarchical frame feature extractor yields two distinct representations for motion primitives and temporal disambiguation. For compact representation, a context router with range-specific queries is employed to produce compact context features across multiple history lengths. And an auxiliary objective of reconstructing historical information is introduced to ensure that the context router acts as an effective bottleneck. We meticulously design 7 tasks and verify that PAM can handle multiple scenarios of state ambiguity simultaneously. With a history window of approximately 10 seconds, PAM still supports stable training and maintains inference speeds above 20Hz. Project website: https://tinda24.github.io/pam/
- Abstract(参考訳): 状態の曖昧さはロボット操作において一般的である。
同一の観測は、複数の有効な行動軌跡に対応することがある。
バイスモータポリシーは、現在のタスクフェーズを特定するために、履歴から適切なタイプの情報とレベルを正しく抽出する必要がある。
しかし, 履歴ウィンドウの拡張は計算コストが高く, 過度なオーバーフィッティングを引き起こす可能性がある。
人間の推論の連続性と作業記憶の復号化に着想を得て,適応型ワーキングメモリを備えた新しいビジュモータ政策であるPAMを導入する。
2段階のトレーニングコストが最小限に抑えられ、PAMは300フレームの履歴ウィンドウをサポートし、高い推論速度を維持している。
具体的には、階層的なフレーム特徴抽出器は、運動プリミティブと時間的曖昧さの2つの異なる表現を与える。
コンパクトな表現には、複数の履歴の長さにまたがるコンパクトなコンテキスト特徴を生成するために、範囲固有のクエリを持つコンテキストルータを用いる。
また、コンテキストルータが効果的なボトルネックとして機能することを保証するために、歴史的情報を再構築する補助的目的を導入する。
我々は、7つのタスクを慎重に設計し、PAMが複数の状態曖昧性のシナリオを同時に処理できることを検証する。
履歴ウィンドウは約10秒で、PAMは安定したトレーニングをサポートし、20Hz以上の推論速度を維持する。
プロジェクトウェブサイト: https://tinda24.github.io/pam/
関連論文リスト
- MemoAct: Atkinson-Shiffrin-Inspired Memory-Augmented Visuomotor Policy for Robotic Manipulation [6.490934654648497]
MemoActは階層的なメモリベースのポリシーであり、特定のボトルネックに対処するために異なるメモリ層を利用する。
MemoActは、既存のMarkovianベースラインと履歴対応ポリシーの両方と比較して、優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-19T05:02:43Z) - VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory [31.464584758455356]
VPWEMは、ワーキングメモリとエピソードメモリを備えた非マルコフヴィジュモータ政策である。
動作生成には短期情報とエピソードワイド情報の両方を使用し、1ステップあたりのメモリと計算がほぼ一定である。
論文 参考訳(メタデータ) (2026-03-05T07:52:50Z) - Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining [56.62125584296097]
Keyframe-Chaining VLAは、キー履歴フレームを抽出し、長い水平依存関係をモデル化するフレームワークである。
本研究では,現在の実行フェーズに対する時間的関連性に基づいて,動的に履歴フレームを検索する進捗対応機構を設計する。
タスク成功率を測定するために,ManiSkillシミュレータ上に構築された4つの非マルコフ操作タスクスイートを紹介する。
論文 参考訳(メタデータ) (2026-03-02T05:26:29Z) - STaR: Scalable Task-Conditioned Retrieval for Long-Horizon Multimodal Robot Memory [16.76678779219906]
移動ロボットは、様々なオープンでダイナミックなシーンで長時間展開されることが多い。
主な課題は、計画、検索、推論のためのエージェントワークフローをサポートするスケーラブルなロングホライゾンメモリを構築することである。
本稿では,タスクに依存しないマルチモーダル長期メモリSTaRを提案する。
論文 参考訳(メタデータ) (2026-02-09T22:38:53Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - Quantifying Memory Use in Reinforcement Learning with Temporal Range [51.98491034847041]
時間的範囲(Temporal Range)は、時間的影響プロファイルとして、時間的ウィンドウから入力シーケンスへの複数のベクトル出力の1次感度を扱うモデルに依存しない計量である。
また、タスクレベルメモリのプロキシ読み出しとして、タスク上で訓練されたコンパクトなLong Expressive Memory(LEM)ポリシーについて、テンポラルレンジを報告する。
論文 参考訳(メタデータ) (2025-12-05T22:58:09Z) - MemER: Scaling Up Memory for Robot Control via Experience Retrieval [46.5398413633767]
人間は日常的にメモリをタスクに頼っているが、ほとんどのロボットポリシーはこの機能を欠いている。
本稿では,その経験から過去の関連事項を選択し,追跡するために,ハイレベルな政策を訓練する階層的な政策枠組みを提案する。
我々のアプローチであるMemERは、数分のメモリを必要とする3つの現実世界の長距離ロボット操作タスクにおいて、従来の手法よりも優れています。
論文 参考訳(メタデータ) (2025-10-23T08:26:17Z) - Memo: Training Memory-Efficient Embodied Agents with Reinforcement Learning [53.72709564555407]
Memoは、強化学習のためのトランスフォーマーベースのアーキテクチャとトレーニングのレシピである。
トレーニング中のモデルの入力と周期的な要約トークンをインターリーブすることで、メモリの生成と検索を組み込む。
グリッドワールドメタRLベンチマークとマルチオブジェクトナビゲーションタスクにおけるMemoの有効性を,フォトリアリスティック屋内環境で実証する。
論文 参考訳(メタデータ) (2025-10-22T16:24:47Z) - Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。
具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを紹介する。
バスケットボールU,サッカーU,サッカーUの3つの実践的スポーツデータセットをベンチマークして評価を行った。
論文 参考訳(メタデータ) (2024-05-27T22:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。