論文の概要: Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory and Autonomous Knowledge Induction
- arxiv url: http://arxiv.org/abs/2605.18729v1
- Date: Mon, 18 May 2026 17:52:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:50.21768
- Title: Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory and Autonomous Knowledge Induction
- Title(参考訳): Robo-Cortex:デュアルグラインド認知記憶と自律的知識誘導による自己進化型身体的エージェント
- Authors: Nga Teng Chan, Yi Zhang, Yechi Liu, Renwen Cui, Fanhu Zeng, Zeyuan Ding, Xiancong Ren, Zhang Zhang, Qifeng Chen, Jian Liu, Yong Dai, Xiaozhu Ju,
- Abstract要約: RoboCortexは、ロボットがナビゲーションと認知戦略を自律的に誘導することを可能にする、自己進化型のフレームワークである。
我々の中心となる革新は、多モード軌跡を構造化ナビゲーションヒューリスティックライブラリーに蒸留する自律的知識誘導機構である。
我々は,RoboCortexがタスク成功と探索効率の両方において,高いベースラインを一貫して上回っていることを示す。
- 参考スコア(独自算出の注目度): 40.686692342584884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to navigate and interact with complex environments is central to real-world embodied agents, yet navigation in unseen environments remains challenging due to "experiential amnesia," where existing trajectory-driven or reactive policies fail to synthesize generalizable strategies from past interactions. We propose Robo-Cortex, a self-evolving framework that enables robots to autonomously induce navigation heuristics and refine cognitive strategies through a continuous reflection-adaptation loop. By abstracting success patterns and failure pitfalls into natural-language heuristics, Robo-Cortex enables a transition from passive execution to active strategy evolution. Our core innovation is an Autonomous Knowledge Induction (AKI) mechanism that distills multimodal trajectories into a structured Navigation Heuristic Library for knowledge generalization. The architecture further incorporates a Dual-Grain Cognitive Memory system, comprising a Short-term Reflective Memory (SRM) for real-time local progress analysis, and a Long-term Principle Memory (LPM) that abstracts past trajectories into reusable guiding and cautionary principles. To ensure robust decision-making, we introduce a multimodal Imagine-then-Verify loop, where a world model simulates potential outcomes and a VLM-based evaluator validates action plans. Extensive evaluations on IGNav, AR, and AEQA show that Robo-Cortex consistently outperforms strong baselines in both task success and exploration efficiency, with gains of up to +4.16% SPL over the strongest prior method and up to +15.30% SPL under heuristic transfer to unseen environments. Preliminary real-world robotic experiments further support the effectiveness of Robo-Cortex in physical settings.
- Abstract(参考訳): 複雑な環境をナビゲートし、相互作用する能力は、現実世界の具体化エージェントの中心であるが、既存の軌道駆動または反応性ポリシーが過去の相互作用から一般化可能な戦略を合成できない「経験的な記憶」のため、目に見えない環境でのナビゲーションは依然として困難である。
ロボットが自律的にナビゲーションヒューリスティックを誘導し、継続的なリフレクション適応ループを通じて認知戦略を洗練できる自己進化型フレームワークであるRobo-Cortexを提案する。
成功パターンと失敗の落とし穴を自然言語ヒューリスティックに抽象化することで、Robo-Cortexは受動的実行からアクティブな戦略進化への移行を可能にする。
我々の中心となる革新は、知識一般化のための構造化ナビゲーションヒューリスティックライブラリにマルチモーダル軌道を蒸留する自律的知識誘導(AKI)機構である。
このアーキテクチャには、リアルタイムローカルプログレス分析のための短期反射メモリ(SRM)と、過去の軌跡を再利用可能な指針と警告原則に抽象化する長期原理メモリ(LPM)が含まれている。
堅牢な意思決定を実現するために,世界モデルが潜在的成果をシミュレートし,VLMに基づく評価器が行動計画を検証するマルチモーダルImagine-then-Verifyループを導入する。
IGNav、AR、AEQAの広範囲な評価によると、Robo-Cortexはタスクの成功と探索の効率の両方において、強いベースラインを一貫して上回り、最強の先行手法では+4.16%、ヒューリスティックな環境への移動では+15.30%のSPLを獲得した。
予備的な実世界のロボット実験は、物理環境におけるロボコルテックスの有効性をさらに支援している。
関連論文リスト
- MORN: Metacognitive Object-Goal Regulation for Resource-Rational Long-Horizon Navigation [8.894907353056125]
認知科学におけるデュアルプロセス理論にインスパイアされたエグゼクティブアーキテクチャであるMORNを紹介する。
潜在指数、永続ゲーティング、エビデンス累積の3つの神経認知状態を定式化することにより、MORNはミッションスケジュールを動的に制御する。
このメカニズムは効果的にサンク・コスト・フォールシーを中和し、エージェントはゾンビの目標を早期に中止し、達成可能な目標に決定的にコミットすることができる。
論文 参考訳(メタデータ) (2026-05-16T10:59:51Z) - Self-Correcting VLA: Online Action Refinement via Sparse World Imagination [55.982504915794514]
本稿では, 自己補正VLA (SC-VLA) を提案する。
SC-VLAは最先端のパフォーマンスを達成し、最高タスクスループットを16%削減し、最高パフォーマンスのベースラインよりも9%高い成功率を得る。
論文 参考訳(メタデータ) (2026-02-25T06:58:06Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Active Intelligence in Video Avatars via Closed-loop World Modeling [55.29966567726842]
現在のビデオアバター生成法は、アイデンティティの保存と動きのアライメントが優れているが、真のエージェンシーは欠如している。
本稿では,L-IVA (Long-Horizon Interactive Visual Avatar) の導入について述べる。
また,ビデオアバターにおける能動的インテリジェンスを実現する最初のフレームワークであるORCAについても紹介する。
論文 参考訳(メタデータ) (2025-12-23T18:59:16Z) - Intrinsic-Motivation Multi-Robot Social Formation Navigation with Coordinated Exploration [7.50564221243905]
協調探索型マルチロボットRLアルゴリズムを提案する。
その中核となるコンポーネントは、政策保守主義を一括して緩和するために設計された自己学習固有の報酬メカニズムである。
ソーシャルフォーメーションナビゲーションベンチマークの実証的な結果は,提案アルゴリズムの優れた性能を示すものである。
論文 参考訳(メタデータ) (2025-12-15T13:03:08Z) - RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.81956345363355]
RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。
大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。
強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2025-05-03T06:17:18Z) - Back-stepping Experience Replay with Application to Model-free Reinforcement Learning for a Soft Snake Robot [15.005962159112002]
Back-stepping Experience Replay (BER)は、任意の外部強化学習アルゴリズムと互換性がある。
柔らかいヘビロボットの移動とナビゲーションのためのモデルレスRLアプローチにおけるBERの適用について述べる。
論文 参考訳(メタデータ) (2024-01-21T02:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。