論文の概要: MORN: Metacognitive Object-Goal Regulation for Resource-Rational Long-Horizon Navigation
- arxiv url: http://arxiv.org/abs/2605.16932v1
- Date: Sat, 16 May 2026 10:59:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:40:28.055208
- Title: MORN: Metacognitive Object-Goal Regulation for Resource-Rational Long-Horizon Navigation
- Title(参考訳): MORN: リソース・リレーション・ロング・ホライゾンナビゲーションのためのメタ認知的オブジェクト指向制御
- Authors: Xi Lin, Jiayi Li, Kangyi Wu, Jiaqiao Tang, Qingrong He, Lin Zhao,
- Abstract要約: 認知科学におけるデュアルプロセス理論にインスパイアされたエグゼクティブアーキテクチャであるMORNを紹介する。
潜在指数、永続ゲーティング、エビデンス累積の3つの神経認知状態を定式化することにより、MORNはミッションスケジュールを動的に制御する。
このメカニズムは効果的にサンク・コスト・フォールシーを中和し、エージェントはゾンビの目標を早期に中止し、達成可能な目標に決定的にコミットすることができる。
- 参考スコア(独自算出の注目度): 8.894907353056125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots deployed in unstructured human environments must frequently execute long-horizon missions, such as find the mug, then the chair, then the printer, under strict operational constraints. While contemporary zero-shot Object Navigation (ObjectNav) agents leverage Vision-Language Models (VLMs) to effectively localize semantic targets, they operate as purely reactive systems that inherently lack global resource awareness. Consequently, these agents inadvertently exhaust critical budgets, including time and battery, on infeasible subgoals due to partial observability, failing to balance local exploration with global mission viability. To bridge this gap by injecting resource-rationality into the navigation loop, we present MORN (Metacognitive Object-goal Regulation Navigation), an executive architecture inspired by Dual-Process Theory in cognitive science. MORN augments frozen navigation backbones with a System 2 meta-controller that continuously monitors the System 1 locomotor. By formalizing three neuro-cognitive states, Potentiality Index, Persistence Gating, and Evidence Accumulation, MORN dynamically regulates the mission schedule based on online estimates of progress velocity and perceptual uncertainty. This mechanism effectively neutralizes the Sunk Cost Fallacy, enabling agents to abort zombie goals early and decisively commit to achievable ones. Extensive experiments on the HM3D dataset demonstrate that MORN improves Goal Completion Rate (CR) from 0.23 to 0.30 and reduces Wasted Step Fraction (WSF) from 0.90 to 0.70, establishing that in resource-constrained autonomy, the metacognitive awareness of global resources is as critical as the reactive ability to navigate.
- Abstract(参考訳): 構造のない人間の環境に配備されたロボットは、マグカップ、椅子、プリンターなどの長い水平任務を厳格な運用制約の下で頻繁に実行しなければならない。
現代のゼロショットオブジェクトナビゲーション(ObjectNav)エージェントは視覚言語モデル(VLM)を利用してセマンティックターゲットを効果的にローカライズするが、それらは本質的にグローバルなリソース認識を欠いている純粋にリアクティブなシステムとして機能する。
その結果、これらのエージェントは、部分的に観測可能であり、局所的な探査とグローバルなミッションの生存性とのバランスが取れなかったため、時間とバッテリーを含む必然的に重要な予算を不必要に消耗させた。
このギャップをナビゲーションループに注入することで埋めるため,認知科学におけるデュアル・プロシース理論に触発されたMORN(Metacognitive Object-Goal Regulation Navigation)を提案する。
MORNはフリーズされたナビゲーションバックボーンをSystem 2メタコントローラで拡張し、System 1のロポモタを継続的に監視する。
潜在指数、永続ゲーティング、エビデンス累積の3つの神経認知状態の形式化により、MORNは進捗速度と知覚の不確実性のオンライン推定に基づいてミッションスケジュールを動的に制御する。
このメカニズムは効果的にサンク・コスト・フォールシーを中和し、エージェントはゾンビの目標を早期に中止し、達成可能な目標に決定的にコミットすることができる。
HM3Dデータセットの大規模な実験は、MORNが目標達成率(CR)を0.23から0.30に改善し、無駄なステップフレーション(WSF)を0.90から0.70に削減し、リソース制約された自律性において、グローバルリソースのメタ認知的認識は、ナビゲートするリアクティブ能力と同じくらい重要であることを証明している。
関連論文リスト
- Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory and Autonomous Knowledge Induction [40.686692342584884]
RoboCortexは、ロボットがナビゲーションと認知戦略を自律的に誘導することを可能にする、自己進化型のフレームワークである。
我々の中心となる革新は、多モード軌跡を構造化ナビゲーションヒューリスティックライブラリーに蒸留する自律的知識誘導機構である。
我々は,RoboCortexがタスク成功と探索効率の両方において,高いベースラインを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2026-05-18T17:52:14Z) - A Deployable Embodied Vision-Language Navigation System with Hierarchical Cognition and Context-Aware Exploration [29.871705369272124]
視覚言語ナビゲーション(VLN)では、既存のアプローチはしばしば、強力な推論能力と現実世界のプラットフォームへの効率的なデプロイのトレードオフに直面します。
本稿では,実世界のロボットプラットフォーム上での高効率かつ堅牢な高レベル推論を実現する,デプロイ可能な組込みVLNシステムを提案する。
論文 参考訳(メタデータ) (2026-04-23T07:27:00Z) - Stop Wandering: Efficient Vision-Language Navigation via Metacognitive Reasoning [12.880792990007244]
トレーニングフリーのビジョンランゲージナビゲーション(VLN)エージェントは、指示に従って3D環境を探索することができる。
既存のアプローチは、強欲なフロンティア選択と受動的空間記憶に依存している。
本稿では,空間記憶,履歴認識計画,反射補正を統合したメタ認知ナビゲーションエージェントMetaNavを提案する。
論文 参考訳(メタデータ) (2026-04-02T17:58:08Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - RADAR: Benchmarking Vision-Language-Action Generalization via Real-World Dynamics, Spatial-Physical Intelligence, and Autonomous Evaluation [76.22852262683746]
本稿では,現実的な条件下でのVLA一般化を体系的に評価するベンチマークであるRADARを紹介する。
RADARを用いて、複数の最先端のVLAモデルを監査し、その明らかな能力の下で深刻な脆弱性を明らかにする。
論文 参考訳(メタデータ) (2026-02-11T16:08:30Z) - AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild [62.47761809929869]
視覚言語ナビゲーション(VLN)は、視覚的観察とともに言語指示を解釈することで、知的エージェントが環境をナビゲートする必要がある。
無人航空機(UAV)の現在のVLN研究は、所定のルートに沿ってUAVを誘導するための詳細な指示に依存している。
本稿では,自律型UAVナビゲーションのためのエンド・ツー・エンドのビジョン・ランゲージ・アクションモデルであるAutoFlyを提案する。
論文 参考訳(メタデータ) (2026-02-10T11:08:07Z) - Percept-WAM: Perception-Enhanced World-Awareness-Action Model for Robust End-to-End Autonomous Driving [48.512353531499286]
本稿では,視覚言語モデル(VLM)に2D/3Dシーン理解能力を暗黙的に統合した知覚強調世界認識行動モデルPercept-WAMを紹介する。
我々は,高密度物体知覚のためのグリッド条件付き予測機構を提案し,IoU対応スコアリングと並列自己回帰デコードを導入し,長距離・遠距離・小対象シナリオの安定性を向上させる。
実験により、パーセプションWAMは下流の知覚ベンチマークで古典的な検出器やセグメンタと一致し、2D検出とBEV 3D検出で51.7/58.9 mAPを達成した。
論文 参考訳(メタデータ) (2025-11-24T15:28:25Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - RAD: Retrieval-Augmented Decision-Making of Meta-Actions with Vision-Language Models in Autonomous Driving [10.984203470464687]
視覚言語モデル(VLM)は、空間認識の不十分さや幻覚といった限界に悩まされることが多い。
本稿では,自律走行シーンにおけるメタアクションを確実に生成するVLMの能力を高めるための,検索強化意思決定(RAD)フレームワークを提案する。
我々は,NuScenesデータセットから得られたデータセットに基づいてVLMを微調整し,その空間的知覚と鳥眼視画像理解能力を高める。
論文 参考訳(メタデータ) (2025-03-18T03:25:57Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。