論文の概要: ESCAPE: Episodic Spatial Memory and Adaptive Execution Policy for Long-Horizon Mobile Manipulation
- arxiv url: http://arxiv.org/abs/2604.13633v1
- Date: Wed, 15 Apr 2026 09:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.458827
- Title: ESCAPE: Episodic Spatial Memory and Adaptive Execution Policy for Long-Horizon Mobile Manipulation
- Title(参考訳): ESCAPE: 長期移動操作における空間記憶と適応実行ポリシー
- Authors: Jingjing Qian, Zeyuan He, Chen Shi, Lei Xiao, Li Jiang,
- Abstract要約: ESCAPEは、密結合した知覚地上実行ワークフローを実装している。
ALFREDベンチマークで最先端のパフォーマンスを達成する。
冗長な探索を減らすことで、ESCAPEはパス長重み付きメトリクスを大幅に改善する。
- 参考スコア(独自算出の注目度): 14.551478545296215
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coordinating navigation and manipulation with robust performance is essential for embodied AI in complex indoor environments. However, as tasks extend over long horizons, existing methods often struggle due to catastrophic forgetting, spatial inconsistency, and rigid execution. To address these issues, we propose ESCAPE (Episodic Spatial Memory Coupled with an Adaptive Policy for Execution), operating through a tightly coupled perception-grounding-execution workflow. For robust perception, ESCAPE features a Spatio-Temporal Fusion Mapping module to autoregressively construct a depth-free, persistent 3D spatial memory, alongside a Memory-Driven Target Grounding module for precise interaction mask generation. To achieve flexible action, our Adaptive Execution Policy dynamically orchestrates proactive global navigation and reactive local manipulation to seize opportunistic targets. ESCAPE achieves state-of-the-art performance on the ALFRED benchmark, reaching 65.09% and 60.79% success rates in test seen and unseen environments with step-by-step instructions. By reducing redundant exploration, our ESCAPE attains substantial improvements in path-length-weighted metrics and maintains robust performance (61.24% / 56.04%) even without detailed guidance for long-horizon tasks.
- Abstract(参考訳): 複雑な屋内環境でAIを具現化するためには、ナビゲーションと堅牢なパフォーマンスによる操作の調整が不可欠である。
しかし、タスクが長い地平線を越えて広がるにつれて、既存のメソッドは破滅的な忘れ物、空間的不整合、厳格な実行のためにしばしば苦労する。
これらの問題に対処するため,我々はESCAPE (Episodic Spatial Memory Coupled with an Adaptive Policy for Execution) を提案する。
堅牢な認識のために、ESCAPEは空間記憶の深みのない永続的な空間記憶を自動回帰的に構築する時空間融合マッピングモジュールと、正確な相互作用マスク生成のためのメモリ駆動ターゲットグラウンドモジュールを備えている。
フレキシブルな行動を達成するために,我々の適応的実行ポリシーは,積極的グローバルナビゲーションとリアクティブな局所操作を動的に編成し,機会的目標を捕捉する。
ESCAPEはALFREDベンチマークで最先端のパフォーマンスを達成し、65.09%と60.79%に到達した。
ESCAPEは冗長な探索を減らすことでパス長重み付きメトリクスを大幅に改善し、長距離タスクの詳細なガイダンスがなくても、堅牢なパフォーマンス(61.24% / 56.04%)を維持します。
関連論文リスト
- Dynamic Control Barrier Function Regulation with Vision-Language Models for Safe, Adaptive, and Realtime Visual Navigation [5.268770735910558]
我々は、エゴセントリックなRGB入力を用いてCBF安全フィルタの保守性をリアルタイムで適応する視覚制御ナビゲーションフレームワークAlphaAdjを提案する。
その結果、AlphaAdjは衝突のないナビゲーションを維持しつつ、(パスの長さとゴールまでの時間の観点から)効率を最大18.5%改善していることがわかった。
論文 参考訳(メタデータ) (2026-03-22T09:35:18Z) - Infinite-World: Scaling Interactive World Models to 1000-Frame Horizons via Pose-Free Hierarchical Memory [101.2076718776139]
複雑な実環境において,1000フレーム以上のコヒーレントな視覚記憶を維持することのできる,堅牢な対話型世界モデルを提案する。
我々は,歴史的潜水剤を固定予算の幾何学的表現に蒸留するpose-free Memory (HPMC)を導入する。
また,連続動作を三状態論理に識別する不確実性認識型アクションラベルモジュールを提案する。
論文 参考訳(メタデータ) (2026-02-02T17:52:56Z) - Heterogeneous Multi-Expert Reinforcement Learning for Long-Horizon Multi-Goal Tasks in Autonomous Forklifts [5.215925647203835]
本稿では,自律フォークリフトに適した異種多目的強化学習(HMER)フレームワークを提案する。
HMERは、長期のタスクをセマンティックタスクプランナーによって制御される特殊なサブポリスに分解する。
本手法は,タスク成功率94.2%(ベースラインの62.5%)を達成し,動作時間を21.4%削減し,配置誤差を1.5cm以内で維持する。
論文 参考訳(メタデータ) (2026-01-12T08:27:24Z) - Hybrid Motion Planning with Deep Reinforcement Learning for Mobile Robot Navigation [0.0]
深部強化学習(HMP-DRL)によるハイブリッド運動計画
状態空間と報酬関数の両方に符号化されたチェックポイントのシーケンスを通じて、局所DRLポリシーに統合されたパスを生成するグラフベースのグローバルプランナを提案する。
社会的コンプライアンスを確保するため、地域プランナーは、周辺エージェントのセマンティックタイプに基づいて、安全マージンと罰則を動的に調整するエンティティ対応報酬構造を採用する。
論文 参考訳(メタデータ) (2025-12-31T05:58:57Z) - STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization [73.98141357780032]
VLN-CEタスクでは、エージェントはシーン固有のトレーニングなしで自然言語命令を使用して3D環境をナビゲートする必要がある。
既存の方法は、構造化された意思決定の欠如と、以前の行動からのフィードバックの不十分な統合のために、堅牢なナビゲーションを達成できないことが多い。
STRIDERは,空間配置先と動的タスクフィードバックを統合し,エージェントの決定空間を体系的に最適化する新しいフレームワークである。
提案手法では,1)空間構造を介して行動空間を制約する構造的ウェイポイントジェネレータ,2)タスクの進行に応じて行動を調整するタスク調整レギュレータ,そしてナビゲーション全体を通して意味的アライメントを確保する。
論文 参考訳(メタデータ) (2025-10-27T04:37:21Z) - FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.18498389833308]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - Object Navigation with Structure-Semantic Reasoning-Based Multi-level Map and Multimodal Decision-Making LLM [18.406869393228813]
環境属性マップ(EAM)とMLLM階層推論モジュール(MHR)を用いたアクティブオブジェクトナビゲーションフレームワークを提案する。
EAMは、観測された環境をSBERTで推論し、観測されていない環境を拡散で予測することによって構築される。
MHRはEAMにインスパイアされてフロンティア探索決定を行い、長距離シナリオにおける回路軌道を避けて経路効率を向上させる。
論文 参考訳(メタデータ) (2025-06-06T09:08:40Z) - GLEAM: Learning Generalizable Exploration Policy for Active Mapping in Complex 3D Indoor Scenes [48.655377892842154]
複雑な未知環境における一般化可能なアクティブマッピングは、移動ロボットにとって重要な課題である。
我々は、アクティブマッピングのための統一的な一般化可能な探索ポリシーであるGLEAMを紹介する。
最先端の手法を大きく上回り、66.50%のカバレッジ(+9.49%)を効率の良い軌道で達成し、128の複雑なシーンでのマッピング精度を改善した。
論文 参考訳(メタデータ) (2025-05-26T17:59:52Z) - Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction [7.918703013303246]
我々は,高次元連続行動空間における決定を学習する上での課題に対処する潜在マクロ行動プランナー(L-MAP)を提案する。
L-MAPは状態条件ベクトル量子変分オートエンコーダ(VQ-VAE)を通して時間的に拡張されたマクロアクションの集合を学習する
連続制御タスクを含むオフラインRL設定では、L-MAPは離散潜在アクションを効率よく探索し、高い期待値が得られる。
論文 参考訳(メタデータ) (2025-02-28T16:02:23Z) - Lifelong Unsupervised Domain Adaptive Person Re-identification with
Coordinated Anti-forgetting and Adaptation [127.6168183074427]
本稿では,LUDA (Lifelong Unsupervised Domain Adaptive) という新たなタスクを提案する。
これは、モデルがターゲット環境のラベル付けされていないデータに継続的に適応する必要があるため、難しい。
我々は、CLUDA-ReIDと呼ばれるこのタスクのための効果的なスキームを設計し、そこでは、アンチフォージェッティングが適応と調和して調整される。
論文 参考訳(メタデータ) (2021-12-13T13:19:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。