論文の概要: POMDP-based Object Search with Growing State Space and Hybrid Action Domain
- arxiv url: http://arxiv.org/abs/2604.14965v1
- Date: Thu, 16 Apr 2026 13:01:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.903886
- Title: POMDP-based Object Search with Growing State Space and Hybrid Action Domain
- Title(参考訳): 成長状態空間とハイブリッド動作領域を用いたPOMDPに基づく物体探索
- Authors: Yongbo Chen, Hesheng Wang, Shoudong Huang, Hanna Kurniawati,
- Abstract要約: 新たなオンラインPOMDPソルバであるGNPF-kCT(英語版)が,この問題に対処するために提案されている。
モンテカルロ木探索 (MCTS) を用いて最適な行動を選択する。
限られた情報や報酬でシナリオに対処するために,グリッドワールドモデルを用いた推定対象オブジェクトも導入する。
- 参考スコア(独自算出の注目度): 25.846438061479446
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficiently locating target objects in complex indoor environments with diverse furniture, such as shelves, tables, and beds, is a significant challenge for mobile robots. This difficulty arises from factors like localization errors, limited fields of view, and visual occlusion. We address this by framing the object-search task as a highdimensional Partially Observable Markov Decision Process (POMDP) with a growing state space and hybrid (continuous and discrete) action spaces in 3D environments. Based on a meticulously designed perception module, a novel online POMDP solver named the growing neural process filtered k-center clustering tree (GNPF-kCT) is proposed to tackle this problem. Optimal actions are selected using Monte Carlo Tree Search (MCTS) with belief tree reuse for growing state space, a neural process network to filter useless primitive actions, and k-center clustering hypersphere discretization for efficient refinement of high-dimensional action spaces. A modified upper-confidence bound (UCB), informed by belief differences and action value functions within cells of estimated diameters, guides MCTS expansion. Theoretical analysis validates the convergence and performance potential of our method. To address scenarios with limited information or rewards, we also introduce a guessed target object with a grid-world model as a key strategy to enhance search efficiency. Extensive Gazebo simulations with Fetch and Stretch robots demonstrate faster and more reliable target localization than POMDP-based baselines and state-of-the-art (SOTA) non-POMDP-based solvers, especially large language model (LLM) based methods, in object search under the same computational constraints and perception systems. Real-world tests in office environments confirm the practical applicability of our approach. Project page: https://sites.google.com/view/gnpfkct.
- Abstract(参考訳): 室内の複雑な環境で、棚、テーブル、ベッドなどの多様な家具で対象物を効率よく配置することは、移動ロボットにとって重要な課題である。
この困難は、ローカライズエラー、限られた視野、視覚的閉塞などの要因から生じる。
本稿では,オブジェクト探索タスクを高次元部分観測可能マルコフ決定プロセス(POMDP)として,状態空間の増大と3次元環境におけるハイブリッド(連続的かつ離散的)な行動空間の増大に対処する。
微妙に設計された知覚モジュールに基づいて、この問題を解決するために、成長するニューラルネットワークフィルタリングk中心クラスタリングツリー(GNPF-kCT)と呼ばれる新しいPOMDPソルバが提案されている。
最適なアクションはモンテカルロ木探索 (MCTS) を用いて選択され、状態空間を成長させるための信仰ツリーの再利用、無駄な原始的なアクションをフィルタリングするニューラルネットワーク、高次元のアクション空間の効率的な洗練のためのk中心クラスタリングハイパースフィアの離散化が可能である。
推定直径のセル内での信頼差と作用値関数によって通知される修正された上信頼境界(UCB)は、MCTSの膨張を誘導する。
理論的解析により,本手法の収束性と性能ポテンシャルを検証した。
限られた情報や報酬を伴うシナリオに対処するために,グリッドワールドモデルを用いた推定対象オブジェクトを探索効率を高めるための重要な戦略として導入する。
Fetch と Stretch ロボットによる大規模な Gazebo シミュレーションでは,POMDP ベースのベースラインや非POMDP ベースの解法,特に大規模言語モデル (LLM) ベースの解法よりも高速で信頼性の高いターゲットローカライゼーションが,同じ計算制約や知覚システム下でのオブジェクト探索において実証されている。
オフィス環境における実世界のテストは、我々のアプローチの実践的適用性を確認します。
プロジェクトページ: https://sites.google.com/view/gnpfkct.com
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Adaptive Discretization using Voronoi Trees for Continuous POMDPs [7.713622698801596]
我々は,Voronoi Trees (ADVT) を用いた適応離散化(Adaptive Discretization)と呼ばれる新しいサンプリングベースのオンラインPOMDPソルバを提案する。
モンテカルロ木探索と、作用空間の適応的な離散化と、楽観的な最適化を組み合わせて、高次元連続作用空間を効率的にサンプリングする。
ADVTは、最先端の手法と比較して、高次元の連続的な作用空間よりもかなり良くスケールする。
論文 参考訳(メタデータ) (2023-02-21T04:47:34Z) - Adaptive Discretization using Voronoi Trees for Continuous-Action POMDPs [7.713622698801596]
我々は,Voronoi Trees (ADVT) を用いた適応離散化(Adaptive Discretization)と呼ばれる新しいサンプリングベースのオンラインPOMDPソルバを提案する。
ADVTはモンテカルロ木探索とアクション空間の適応的な離散化と楽観的な最適化を併用する。
4種類のベンチマーク問題のシミュレーション実験により、ADVTは高次元連続行動空間よりも優れ、スケールがかなり優れていることが示されている。
論文 参考訳(メタデータ) (2022-09-13T05:04:49Z) - Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - Towards Optimal Correlational Object Search [25.355936023640506]
相関オブジェクト探索POMDPは相関情報を用いた探索戦略を作成することができる。
我々は,家庭環境の現実的なシミュレータであるAI2-THORと,広く使用されている物体検出器であるYOLOv5を用いて実験を行った。
論文 参考訳(メタデータ) (2021-10-19T14:03:43Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Multi-Resolution POMDP Planning for Multi-Object Search in 3D [26.683481431467783]
フラストタル形状の視野を持つ3次元領域における多対象探索のためのPOMDPの定式化について述べる。
我々は,対象物体の異なる解像度レベルでの不確かさを捉えるために,新しいオクツリーに基づく信念表現を設計する。
移動ロボットによる2つの10m$2×2$m領域の異なる高さに配置された物体を、ベースを移動させ、胴体を作動させることにより、その位置を推定する手法を実証する。
論文 参考訳(メタデータ) (2020-05-06T14:54:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。