論文の概要: POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments
- arxiv url: http://arxiv.org/abs/2009.08140v1
- Date: Thu, 17 Sep 2020 08:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 12:05:40.939515
- Title: POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments
- Title(参考訳): POMP:Pomcpを用いた屋内環境におけるアクティブビジュアル検索のためのオンラインモーションプランニング
- Authors: Yiming Wang, Francesco Giuliari, Riccardo Berra, Alberto Castellini,
Alessio Del Bue, Alessandro Farinelli, Marco Cristani, Francesco Setti
- Abstract要約: 本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
- 参考スコア(独自算出の注目度): 89.43830036483901
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we focus on the problem of learning an optimal policy for
Active Visual Search (AVS) of objects in known indoor environments with an
online setup. Our POMP method uses as input the current pose of an agent (e.g.
a robot) and a RGB-D frame. The task is to plan the next move that brings the
agent closer to the target object. We model this problem as a Partially
Observable Markov Decision Process solved by a Monte-Carlo planning approach.
This allows us to make decisions on the next moves by iterating over the known
scenario at hand, exploring the environment and searching for the object at the
same time. Differently from the current state of the art in Reinforcement
Learning, POMP does not require extensive and expensive (in time and
computation) labelled data so being very agile in solving AVS in small and
medium real scenarios. We only require the information of the floormap of the
environment, an information usually available or that can be easily extracted
from an a priori single exploration run. We validate our method on the publicly
available AVD benchmark, achieving an average success rate of 0.76 with an
average path length of 17.1, performing close to the state of the art but
without any training needed. Additionally, we show experimentally the
robustness of our method when the quality of the object detection goes from
ideal to faulty.
- Abstract(参考訳): 本稿では,既存の屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーをオンライン設定で学習する問題に焦点をあてる。
提案手法は,エージェント(例えばロボット)とRGB-Dフレームの現在のポーズを入力として使用する。
タスクは、エージェントをターゲットオブジェクトに近づける次の動きを計画することです。
我々は,モンテカルロ計画手法によって解決された部分可観測マルコフ決定過程としてこの問題をモデル化する。
これにより、手元にある既知のシナリオを反復し、環境を探索し、同時にオブジェクトを探すことで、次の動きを決定することができます。
強化学習における現在の技術とは違って、POMPは広範囲で高価なラベル付きデータ(時間と計算)を必要としないため、中小規模のシナリオでAVSを解決する上で非常にアジャイルである。
我々は、環境のフロアマップの情報、通常利用可能な情報、または先駆的な単一の探索ランから容易に抽出できる情報のみを要求する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1を達成し,最先端に近づきながら,必要なトレーニングを伴わない。
さらに,対象検出の品質が理想から欠陥へと変化する場合,本手法のロバスト性を実験的に示す。
関連論文リスト
- Moving Object Segmentation in Point Cloud Data using Hidden Markov Models [0.0]
我々は,移動物体を点クラウドデータにセグメント化するための頑健な学習自由アプローチを提案する。
提案手法はベンチマークデータセット上でテストされ、最先端の手法よりも一貫してパフォーマンスが向上する。
論文 参考訳(メタデータ) (2024-10-24T10:56:02Z) - Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - Model Checking for Closed-Loop Robot Reactive Planning [0.0]
モデル検査を用いて、ディファレンシャルドライブホイールロボットの多段階計画を作成することにより、即時危険を回避できることを示す。
簡単な生物エージェントのエゴセントリックな反応を反映した,小型で汎用的なモデル検査アルゴリズムを用いて,リアルタイムで計画を生成する。
論文 参考訳(メタデータ) (2023-11-16T11:02:29Z) - Probable Object Location (POLo) Score Estimation for Efficient Object
Goal Navigation [15.623723522165731]
本稿では,POLo(Probable Object Location)スコアを中心とした新しいフレームワークを提案する。
計算集約的なPOLoスコアを近似するためにトレーニングされたニューラルネットワークであるPOLoNetを導入することで、フレームワークの実用性をさらに向上する。
OVMM 2023チャレンジの第1フェーズを含む実験では,POLoNetを組み込んだエージェントが,幅広いベースライン手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2023-11-14T08:45:32Z) - Learn to Follow: Decentralized Lifelong Multi-agent Pathfinding via
Planning and Learning [46.354187895184154]
マルチエージェントパスフィンディング(MAPF)問題は通常、グラフに制限されたエージェントの集合に対する競合のないパスの集合を見つけるよう要求する。
本研究では,エージェントの位置や目標に関する情報をすべて収集する中央制御器が存在しない場合の分散MAPF設定について検討する。
我々は,先行するエージェントに新たな目標を連続的に割り当てることを含むMAPFの実用上重要な寿命変化に焦点をあてる。
論文 参考訳(メタデータ) (2023-10-02T13:51:32Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Long Range Object-Level Monocular Depth Estimation for UAVs [0.0]
本稿では,画像からモノクロ物体を長距離検出するための最先端手法の新たな拡張法を提案する。
まず、回帰タスクとして深度推定をモデル化する際、SigmoidおよびReLUライクエンコーディングを提案する。
次に,深度推定を分類問題とし,訓練損失の計算にソフトアルグマックス関数を導入する。
論文 参考訳(メタデータ) (2023-02-17T15:26:04Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。