論文の概要: CogDDN: A Cognitive Demand-Driven Navigation with Decision Optimization and Dual-Process Thinking
- arxiv url: http://arxiv.org/abs/2507.11334v2
- Date: Fri, 15 Aug 2025 09:03:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.468759
- Title: CogDDN: A Cognitive Demand-Driven Navigation with Decision Optimization and Dual-Process Thinking
- Title(参考訳): CogDDN: 意思決定最適化とデュアルプロセス思考を備えた認知的需要駆動ナビゲーション
- Authors: Yuehao Huang, Liang Liu, Shuangming Lei, Yukai Ma, Hao Su, Jianbiao Mei, Pengxiang Zhao, Yaqing Gu, Yong Liu, Jiajun Lv,
- Abstract要約: 人間の認知と学習のメカニズムをエミュレートするVLMベースのフレームワークであるCogDDNを提案する。
CogDDNは、検出されたオブジェクトを所定の命令で意味的にアライメントすることで、適切なターゲットオブジェクトを特定する。
高速かつ効率的な意思決定のためのヒューリスティックプロセスと過去のエラーを分析する分析プロセスで構成される、デュアルプロセスの意思決定モジュールが組み込まれている。
- 参考スコア(独自算出の注目度): 22.817457688303513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile robots are increasingly required to navigate and interact within unknown and unstructured environments to meet human demands. Demand-driven navigation (DDN) enables robots to identify and locate objects based on implicit human intent, even when object locations are unknown. However, traditional data-driven DDN methods rely on pre-collected data for model training and decision-making, limiting their generalization capability in unseen scenarios. In this paper, we propose CogDDN, a VLM-based framework that emulates the human cognitive and learning mechanisms by integrating fast and slow thinking systems and selectively identifying key objects essential to fulfilling user demands. CogDDN identifies appropriate target objects by semantically aligning detected objects with the given instructions. Furthermore, it incorporates a dual-process decision-making module, comprising a Heuristic Process for rapid, efficient decisions and an Analytic Process that analyzes past errors, accumulates them in a knowledge base, and continuously improves performance. Chain of Thought (CoT) reasoning strengthens the decision-making process. Extensive closed-loop evaluations on the AI2Thor simulator with the ProcThor dataset show that CogDDN outperforms single-view camera-only methods by 15\%, demonstrating significant improvements in navigation accuracy and adaptability. The project page is available at https://yuehaohuang.github.io/CogDDN/.
- Abstract(参考訳): 移動ロボットは、人間の要求を満たすために、未知の環境や非構造環境での移動と対話がますます求められている。
DDN(Demand-Driven Navigation)は、オブジェクトの位置が不明な場合でも、暗黙の人間の意図に基づくオブジェクトの特定と発見を可能にする。
しかし、従来のデータ駆動型DDN法は、モデルトレーニングと意思決定のために事前に収集されたデータに依存しており、その一般化能力は見当たらないシナリオで制限される。
本稿では,人間の認知と学習のメカニズムをエミュレートするVLMベースのフレームワークであるCogDDNを提案する。
CogDDNは、検出されたオブジェクトを所定の命令で意味的にアライメントすることで、適切なターゲットオブジェクトを特定する。
さらに、迅速かつ効率的な意思決定のためのヒューリスティック・プロセスと、過去のエラーを分析し、知識ベースに蓄積し、継続的にパフォーマンスを改善する分析・プロセスからなる、デュアルプロセスの意思決定モジュールも組み込まれている。
思考の連鎖(CoT)推論は意思決定プロセスを強化する。
ProcThorデータセットによるAI2Thorシミュレータの大規模なクローズループ評価は、CogDDNがシングルビューカメラのみの手法を15倍に向上し、ナビゲーション精度と適応性を大幅に向上したことを示している。
プロジェクトページはhttps://yuehaohuang.github.io/CogDDN/で公開されている。
関連論文リスト
- CogNav: Cognitive Process Modeling for Object Goal Navigation with LLMs [33.123447047397484]
オブジェクトゴールナビゲーション(Object goal navigation、ObjectNav)は、AIの具体化における基本的なタスクであり、エージェントが以前目に見えない環境でターゲットオブジェクトを見つける必要がある。
大規模言語モデルを用いた認知過程の模倣を目的としたフレームワークであるCogNavを提案する。
CogNavは、少なくとも最先端技術に比べて、ObjectNavの成功率を14%向上させる。
論文 参考訳(メタデータ) (2024-12-11T09:50:35Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z) - Run-time Introspection of 2D Object Detection in Automated Driving
Systems Using Learning Representations [13.529124221397822]
ディープニューラルネットワーク(DNN)に基づく2次元物体検出のための新しいイントロスペクションソリューションを提案する。
KITTIとBDDのデータセットで評価された1段階および2段階のオブジェクト検出器を用いて,2次元オブジェクト検出におけるエラー検出のためのSOTAイントロスペクション機構を実装した。
性能評価の結果,提案手法はSOTA法より優れており,BDDデータセットのエラー率を9%から17%まで絶対的に削減できることがわかった。
論文 参考訳(メタデータ) (2024-03-02T10:56:14Z) - Extracting Process-Aware Decision Models from Object-Centric Process
Data [54.04724730771216]
本稿では,ODDA(Integrated Object-centric Decision Discovery Algorithm)と呼ばれる,オブジェクト中心決定マイニングアルゴリズムを提案する。
IODDAは意思決定の仕組みや意思決定の仕方を知ることができる。
論文 参考訳(メタデータ) (2024-01-26T13:27:35Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - Performance Study of YOLOv5 and Faster R-CNN for Autonomous Navigation
around Non-Cooperative Targets [0.0]
本稿では,カメラと機械学習アルゴリズムを組み合わせることで,相対的なナビゲーションを実現する方法について論じる。
高速領域ベース畳み込みニューラルネットワーク(R-CNN)とYou Only Look Once(YOLOv5)の2つのディープラーニングに基づくオブジェクト検出アルゴリズムの性能を検証した。
本稿では, 特徴認識アルゴリズムの実装と, 宇宙船誘導航法制御システムへの統合に向けての道筋について論じる。
論文 参考訳(メタデータ) (2023-01-22T04:53:38Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Centralizing State-Values in Dueling Networks for Multi-Robot
Reinforcement Learning Mapless Navigation [87.85646257351212]
本稿では,CTDE(Training and Decentralized Execution)パラダイムにおけるマルチロボットマップレスナビゲーションの問題点について考察する。
この問題は、各ロボットが観察を他のロボットと明示的に共有することなく、その経路を考えると困難である。
我々は,集中型状態値ネットワークを用いて共同状態値を計算するCTDEの新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-16T16:47:00Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Reducing DNN Labelling Cost using Surprise Adequacy: An Industrial Case
Study for Autonomous Driving [23.054842564447895]
ディープニューラルネットワーク(Deep Neural Networks, DNN)は、自動運転に不可欠なタスクにおける優れたパフォーマンスのため、自動車業界で急速に採用されている。
本稿では、サプライズ・アデクシー(SA)とモデル性能の相関を利用して、DNNに基づくオブジェクトセグメンテーションの開発を改善する方法について述べる。
産業ケーススタディでは,不正確な評価で最大50%のコスト削減が可能であった。
論文 参考訳(メタデータ) (2020-05-29T06:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。