論文の概要: Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics
- arxiv url: http://arxiv.org/abs/2603.25366v1
- Date: Thu, 26 Mar 2026 12:15:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.279162
- Title: Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics
- Title(参考訳): 移動ロボットにおけるObjectNavの深部RLとベイズ推論の統合
- Authors: João Castelo-Branco, José Santos-Victor, Alexandre Bernardino,
- Abstract要約: 本稿では,ベイズ推論と深層強化学習を統合したハイブリッドオブジェクト探索フレームワークを提案する。
提案手法はHabitat 3.0を用いた室内シミュレーションで評価し, 開発したベースライン戦略と比較した。
- 参考スコア(独自算出の注目度): 46.43747905376494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous object search is challenging for mobile robots operating in indoor environments due to partial observability, perceptual uncertainty, and the need to trade off exploration and navigation efficiency. Classical probabilistic approaches explicitly represent uncertainty but typically rely on handcrafted action-selection heuristics, while deep reinforcement learning enables adaptive policies but often suffers from slow convergence and limited interpretability. This paper proposes a hybrid object-search framework that integrates Bayesian inference with deep reinforcement learning. The method maintains a spatial belief map over target locations, updated online through Bayesian inference from calibrated object detections, and trains a reinforcement learning policy to select navigation actions directly from this probabilistic representation. The approach is evaluated in realistic indoor simulation using Habitat 3.0 and compared against developed baseline strategies. Across two indoor environments, the proposed method improves success rate while reducing search effort. Overall, the results support the value of combining Bayesian belief estimation with learned action selection to achieve more efficient and reliable objectsearch behavior under partial observability.
- Abstract(参考訳): 自律的な物体探索は、部分的な観測可能性、知覚的不確実性、探索と航法効率のトレードオフの必要性により、屋内環境で動作する移動ロボットにとって困難である。
古典的確率論的アプローチは明確に不確実性を表すが、通常手作りの行動選択ヒューリスティックに依存し、深い強化学習は適応的な政策を可能にするが、しばしば緩やかな収束と限定的な解釈性に悩まされる。
本稿では,ベイズ推論と深層強化学習を統合したハイブリッドオブジェクト探索フレームワークを提案する。
本手法は,目標位置上の空間的信念マップを維持し,校正対象検出からベイズ推定を通じてオンラインに更新し,この確率的表現から直接ナビゲーション行動を選択するための強化学習ポリシーを訓練する。
提案手法はHabitat 3.0を用いた室内シミュレーションで評価し, 開発したベースライン戦略と比較した。
2つの屋内環境にまたがって,探索の労力を減らしながら成功率を向上させる手法を提案する。
全体として,ベイズ的信念推定と学習行動選択を組み合わせることで,部分観測可能性下でのより効率的で信頼性の高い対象探索行動を実現することができる。
関連論文リスト
- Proprioceptive Safe Active Navigation and Exploration for Planetary Environments [2.2120851074630177]
Proprioceptive Safe Active Navigation and Exploration (PSANE)は、未知の変形可能な環境における安全なナビゲーションと探索のためのフレームワークである。
PSANEはガウスプロセスレグレッションを通じてトラバーサビリティモデルを学び、安全な領域を推定し、認定する。
リアルタイムナビゲーションのためのリアクティブコントローラとこれらの見積を統合する。
論文 参考訳(メタデータ) (2026-03-09T20:17:50Z) - Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-07T02:24:44Z) - Adaptive Target Localization under Uncertainty using Multi-Agent Deep Reinforcement Learning with Knowledge Transfer [15.605693371392212]
本研究は,不確実環境におけるターゲット位置推定のためのMADRLに基づく新しい手法を提案する。
エージェントの観察は、環境に不可欠な情報を捉えるために最適化された方法で設計されている。
ディープラーニングモデルは、MADRLモデルからの知識に基づいて、到達不可能な場合のターゲット位置を正確に推定する。
論文 参考訳(メタデータ) (2025-01-19T02:58:22Z) - Belief Aided Navigation using Bayesian Reinforcement Learning for Avoiding Humans in Blind Spots [0.0]
本研究では、部分的に観測可能なマルコフ決定プロセスフレームワークに基づく新しいアルゴリズムBNBRL+を導入し、観測不能領域のリスクを評価する。
ロボット、人間、そして推論された信念のダイナミクスを統合し、ナビゲーションパスを決定し、報酬関数に社会規範を埋め込む。
このモデルでは、視認性に限界があり、障害物を動的に回避できるため、自動運転車の安全性と信頼性を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-15T08:50:39Z) - Probable Object Location (POLo) Score Estimation for Efficient Object
Goal Navigation [15.623723522165731]
本稿では,POLo(Probable Object Location)スコアを中心とした新しいフレームワークを提案する。
計算集約的なPOLoスコアを近似するためにトレーニングされたニューラルネットワークであるPOLoNetを導入することで、フレームワークの実用性をさらに向上する。
OVMM 2023チャレンジの第1フェーズを含む実験では,POLoNetを組み込んだエージェントが,幅広いベースライン手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2023-11-14T08:45:32Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - A Contextual Bandit Approach for Learning to Plan in Environments with
Probabilistic Goal Configurations [20.15854546504947]
本研究では,静的なオブジェクトだけでなく可動なオブジェクトに対しても,屋内環境を効率的に探索できるオブジェクトナビのためのモジュラーフレームワークを提案する。
我々は,不確実性に直面した場合の楽観性を示すことにより,環境を効率的に探索する。
提案アルゴリズムを2つのシミュレーション環境と実世界の環境で評価し,高いサンプル効率と信頼性を示す。
論文 参考訳(メタデータ) (2022-11-29T15:48:54Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。