論文の概要: A Contextual Bandit Approach for Learning to Plan in Environments with
Probabilistic Goal Configurations
- arxiv url: http://arxiv.org/abs/2211.16309v1
- Date: Tue, 29 Nov 2022 15:48:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 18:17:44.004369
- Title: A Contextual Bandit Approach for Learning to Plan in Environments with
Probabilistic Goal Configurations
- Title(参考訳): 確率的目標構成をもつ環境における計画学習のためのコンテキスト帯域アプローチ
- Authors: Sohan Rudra, Saksham Goel, Anirban Santara, Claudio Gentile, Laurent
Perron, Fei Xia, Vikas Sindhwani, Carolina Parada, Gaurav Aggarwal
- Abstract要約: 本研究では,静的なオブジェクトだけでなく可動なオブジェクトに対しても,屋内環境を効率的に探索できるオブジェクトナビのためのモジュラーフレームワークを提案する。
我々は,不確実性に直面した場合の楽観性を示すことにより,環境を効率的に探索する。
提案アルゴリズムを2つのシミュレーション環境と実世界の環境で評価し,高いサンプル効率と信頼性を示す。
- 参考スコア(独自算出の注目度): 20.15854546504947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object-goal navigation (Object-nav) entails searching, recognizing and
navigating to a target object. Object-nav has been extensively studied by the
Embodied-AI community, but most solutions are often restricted to considering
static objects (e.g., television, fridge, etc.). We propose a modular framework
for object-nav that is able to efficiently search indoor environments for not
just static objects but also movable objects (e.g. fruits, glasses, phones,
etc.) that frequently change their positions due to human intervention. Our
contextual-bandit agent efficiently explores the environment by showing
optimism in the face of uncertainty and learns a model of the likelihood of
spotting different objects from each navigable location. The likelihoods are
used as rewards in a weighted minimum latency solver to deduce a trajectory for
the robot. We evaluate our algorithms in two simulated environments and a
real-world setting, to demonstrate high sample efficiency and reliability.
- Abstract(参考訳): Object-goal Navigation (Object-nav) は、ターゲットオブジェクトを検索、認識、ナビゲートする。
Object-navはEmbodied-AIコミュニティによって広く研究されてきたが、ほとんどのソリューションは静的なオブジェクト(テレビ、冷蔵庫など)に制限されている。
本研究では,静的な物体だけでなく,人間の介入によって頻繁に位置を変化させる移動体(果物,眼鏡,電話など)の屋内環境を効率的に探索できるオブジェクトナビのためのモジュラーフレームワークを提案する。
不確実性に直面して楽観性を示し、各ナビゲート可能な場所から異なる物体を発見できる可能性のモデルを学び、効率的に環境を探索する。
確率は、ロボットの軌道を推測するために、重み付き最小レイテンシソルバの報酬として使用される。
提案アルゴリズムを2つのシミュレーション環境と実世界の環境で評価し,高いサンプル効率と信頼性を示す。
関連論文リスト
- Probable Object Location (POLo) Score Estimation for Efficient Object
Goal Navigation [15.623723522165731]
本稿では,POLo(Probable Object Location)スコアを中心とした新しいフレームワークを提案する。
計算集約的なPOLoスコアを近似するためにトレーニングされたニューラルネットワークであるPOLoNetを導入することで、フレームワークの実用性をさらに向上する。
OVMM 2023チャレンジの第1フェーズを含む実験では,POLoNetを組み込んだエージェントが,幅広いベースライン手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2023-11-14T08:45:32Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Learning Hierarchical Interactive Multi-Object Search for Mobile
Manipulation [10.21450780640562]
本稿では,ロボットが扉を開けて部屋をナビゲートし,キャビネットや引き出しの中を探索し,対象物を見つける,インタラクティブな多目的探索タスクを提案する。
これらの新たな課題は、探索されていない環境での操作とナビゲーションのスキルを組み合わせる必要がある。
本研究では,探索,ナビゲーション,操作のスキルを習得する階層的強化学習手法であるHIMOSを提案する。
論文 参考訳(メタデータ) (2023-07-12T12:25:33Z) - PONI: Potential Functions for ObjectGoal Navigation with
Interaction-free Learning [125.22462763376993]
対話自由学習(PONI)を用いたオブジェクト指向ナビゲーションの可能性について提案する。
PONIは、物がどこに見えるかというスキルと、どのように(x, y)にナビゲートするかを歪めます。」
論文 参考訳(メタデータ) (2022-01-25T01:07:32Z) - Landmark Policy Optimization for Object Navigation Task [77.34726150561087]
本研究は,未確認環境において,与えられたセマンティックカテゴリに関連する最も近いオブジェクトにナビゲートするオブジェクトゴールナビゲーションタスクについて研究する。
最近の研究は、エンドツーエンドの強化学習アプローチとモジュールシステムの両方において大きな成果を上げていますが、堅牢で最適なものにするには大きな前進が必要です。
本稿では,これらのランドマークを抽出する手法として,標準的なタスクの定式化とランドマークとしての付加的な地域知識を取り入れた階層的手法を提案する。
論文 参考訳(メタデータ) (2021-09-17T12:28:46Z) - Dynamic and Static Object Detection Considering Fusion Regions and
Point-wise Features [7.41540085468436]
本稿では,自動運転車の前方における静的・動的物体の検出手法を提案する。
われわれのアプローチは、検出された物体から、その位置、速度、方向などの他の特徴を得ることもできる。
提案手法の性能を示すために,ベンチマークデータセットと,自律プラットフォームから得られた実世界のデータを用いて評価する。
論文 参考訳(メタデータ) (2021-07-27T09:42:18Z) - Analysis of voxel-based 3D object detection methods efficiency for
real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。
実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。
この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文 参考訳(メタデータ) (2021-05-21T12:40:59Z) - ViNG: Learning Open-World Navigation with Visual Goals [82.84193221280216]
視覚的目標達成のための学習に基づくナビゲーションシステムを提案する。
提案手法は,我々がvingと呼ぶシステムが,目標条件強化学習のための提案手法を上回っていることを示す。
我々は、ラストマイル配送や倉庫検査など、現実の多くのアプリケーションでViNGを実演する。
論文 参考訳(メタデータ) (2020-12-17T18:22:32Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z) - Learning hierarchical relationships for object-goal navigation [7.074818959144171]
室内におけるナビゲーションのためのメモリ利用共同階層型物体学習(MJOLNIR)を提案する。
MJOLNIRはターゲット駆動ナビゲーションアルゴリズムであり、ターゲットオブジェクトと周囲に存在するより健全なコンテキストオブジェクトの間に固有の関係を考察する。
我々のモデルは、よく知られた過適合問題に悩まされることなく、他のアルゴリズムよりもはるかに早く収束することを学ぶ。
論文 参考訳(メタデータ) (2020-03-15T04:01:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。