論文の概要: TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation
- arxiv url: http://arxiv.org/abs/2606.14551v2
- Date: Tue, 16 Jun 2026 07:41:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.712543
- Title: TRACE: Trajectory-Routed Causal Memory for Delayed-Evidence Visuomotor Imitation
- Title(参考訳): TRACE:遅延エビデンス・ビジュモータ・イミュレーションのための軌道制御型因果記憶
- Authors: Zihao Li, Ranpeng Qiu, Yincong Chen, Guoqiang Ren, Weiming Zhi,
- Abstract要約: 我々は、後続の意思決定ポイントの前に早期のキューが消える遅延証拠タスクについて研究する。
本稿では,ビジュモータ模倣ポリシーのメモリフレームワークであるTRACE(TRAjectory-routed Causal Evidence)を紹介する。
TRACEはタスク関連視覚的およびロボット状態の証拠を、長いエピソードに縛り付けられている固定サイズの潜伏メモリに格納する。
- 参考スコア(独自算出の注目度): 8.251241299679732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots under autonomous operation may require decisions based on evidence that is no longer visible. We study delayed-evidence tasks, where an early cue disappears before a later decision point, so visually similar observations can require different actions. In these settings, the current observation is not a sufficient state for control. We introduce TRAjectory-routed Causal Evidence (TRACE), a memory framework for visuomotor imitation policies. TRACE stores task-relevant visual and robot-state evidence, such as object identity, target choice, or route-dependent state, in a fixed-size latent memory that remains bounded over long episodes. Instead of indexing memory by raw time or manually provided task labels, TRACE uses path signatures: compact, order-sensitive features of the executed robot-state trajectory. These signatures do not store the visual cue itself; rather, they provide trajectory-conditioned keys for writing and retrieving the evidence stored when the cue was visible. When the robot later reaches an ambiguous observation, the policy conditions on TRACE memory to recover the missing context and choose the correct branch. TRACE attaches through lightweight adapters to policies, without changing the policy backbone, action head, or imitation objective. Across real-world long-horizon manipulation tasks with visually ambiguous branch points, TRACE improves branch selection and task success over alternative baselines, including short-history and recurrent memory. Project page: https://jeong-zju.github.io/trace
- Abstract(参考訳): 自律運転中のロボットは、もはや見えない証拠に基づいて決定する必要があるかもしれない。
我々は、後続の意思決定ポイントの前に早期のキューが消える遅延証拠タスクを研究し、視覚的に類似した観察は異なる行動を必要とする可能性がある。
これらの設定では、現在の観測は制御に十分な状態ではない。
本稿では,ビジュモータ模倣ポリシーのメモリフレームワークであるTRACE(TRAjectory-routed Causal Evidence)を紹介する。
TRACEは、オブジェクトアイデンティティ、ターゲット選択、ルート依存状態などのタスク関連視覚的およびロボット状態のエビデンスを、長いエピソードに拘束されたままの固定サイズの潜在メモリに格納する。
TRACEは、生の時間でメモリをインデックスする代わりに、実行中のロボット状態軌跡のコンパクトで順序に敏感な特徴であるパスシグネチャを使用する。
これらのシグネチャは、視覚的なキュー自体を格納せず、むしろ、キューが見えるときに保存された証拠を記述および検索するための軌跡条件付きキーを提供する。
その後、ロボットがあいまいな観察に達すると、TRACEメモリのポリシー条件により、行方不明のコンテキストを回復し、正しいブランチを選択する。
TRACEは、ポリシーバックボーン、アクションヘッド、模倣対象を変更することなく、ポリシーへの軽量アダプタを通じてアタッチする。
視覚的に曖昧な分岐点を持つ現実世界の長距離操作タスク全体において、TRACEは、短履歴や繰り返しメモリを含む代替ベースラインよりも分岐選択とタスク成功を改善している。
プロジェクトページ: https://jeong-zju.github.io/trace
関連論文リスト
- EvoMemNav: Efficient Self-Evolving Fine-Grained Memory for Zero-Shot Embodied Navigation [81.54723508469617]
EvoMemNavは、ゼロショットエンボディナビゲーションのための効率的で自己進化的できめ細かいメモリフレームワークである。
VSMGraphは、セマンティックキューとトポロジ的関係を持つビューをルームビューオブジェクト階層に整理する。
GOAT-BenchとHM3Dのオブジェクト、テキスト記述、画像ゴールのモダリティによる実験は、SR/SPLにおいて一貫した利得を示している。
論文 参考訳(メタデータ) (2026-06-02T11:27:44Z) - STAMP: Training Explicit Memory for Mobile GUI Agents in Controllable and Scalable Virtual Environments [63.39393178045112]
モバイルエージェントは即座に反応制御を行うが、メモリを必要とする現実的なロングホライゾンタスクでは頻繁に失敗する。
制御可能な仮想環境を通じて,モバイルエージェントの明示的なメモリをトレーニングするフレームワークSTAMPを提案する。
結果のStampGUIエージェントは、メモリワールドベンチマークに新たなハイウォーターマークを設定し、例外的なメモリ精度とタスクレジリエンスを実証します。
論文 参考訳(メタデータ) (2026-05-28T04:00:13Z) - SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent [51.274445160155864]
ロングホライゾンのエージェント推論は、思考、ツールコール、観察、部分的な結論を含む長い相互作用履歴を通して行動するために大きな言語モデルを必要とする。
既存のアプローチでは、インタラクション履歴の切り抜き、短いサロゲートに圧縮、あるいは再利用のために選択した部分を取得することで、この問題に対処している。
我々は、インテント駆動リコールのための生のトラジェクトリページを保持しながら、継続的なインタラクションをコンパクトなメモリキューに統合するスタンドアロンフレームワークであるState-Adaptive Memoryを提案する。
論文 参考訳(メタデータ) (2026-05-23T08:37:16Z) - MemEye: A Visual-Centric Evaluation Framework for Multimodal Agent Memory [80.97855900579512]
既存の評価では、エージェントが後続の推論に必要な視覚的証拠を保存するかどうかを検査することはめったにない。
メモリ性能を2次元から評価するフレームワークであるMemEyeを紹介する。
本フレームワークでは,8つのライフシナリオタスクにまたがる新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2026-05-14T17:37:52Z) - Mem-W: Latent Memory-Native GUI Agents [50.87647372904382]
本稿では,メモリをエージェントの連続的コンテキストの一部として扱う,潜在メモリネイティブなGUIエージェントであるMem-Wを紹介する。
4つのWebおよびモバイルナビゲーションベンチマークで、Mem-Wはさまざまなバックボーンとメモリ拡張ベースラインを一貫して改善している。
論文 参考訳(メタデータ) (2026-05-10T04:31:23Z) - MemoAct: Atkinson-Shiffrin-Inspired Memory-Augmented Visuomotor Policy for Robotic Manipulation [6.490934654648497]
MemoActは階層的なメモリベースのポリシーであり、特定のボトルネックに対処するために異なるメモリ層を利用する。
MemoActは、既存のMarkovianベースラインと履歴対応ポリシーの両方と比較して、優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-19T05:02:43Z) - Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining [56.62125584296097]
Keyframe-Chaining VLAは、キー履歴フレームを抽出し、長い水平依存関係をモデル化するフレームワークである。
本研究では,現在の実行フェーズに対する時間的関連性に基づいて,動的に履歴フレームを検索する進捗対応機構を設計する。
タスク成功率を測定するために,ManiSkillシミュレータ上に構築された4つの非マルコフ操作タスクスイートを紹介する。
論文 参考訳(メタデータ) (2026-03-02T05:26:29Z) - Resolving State Ambiguity in Robot Manipulation via Adaptive Working Memory Recoding [12.400431805327093]
PAMはアダプティブ・ワーキング・メモリを備えた新しいビズモータ・ポリシーである。
300フレームの履歴ウィンドウをサポートし、高い推論速度を維持している。
我々は、7つのタスクを慎重に設計し、PAMが複数の状態曖昧性のシナリオを同時に処理できることを検証する。
論文 参考訳(メタデータ) (2025-12-31T05:20:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。