論文の概要: Comparison of Model-Free and Model-Based Learning-Informed Planning for
PointGoal Navigation
- arxiv url: http://arxiv.org/abs/2212.08801v1
- Date: Sat, 17 Dec 2022 05:23:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 18:35:41.456711
- Title: Comparison of Model-Free and Model-Based Learning-Informed Planning for
PointGoal Navigation
- Title(参考訳): ポイントゴールナビゲーションにおけるモデルフリーとモデルベース学習インフォームドプランニングの比較
- Authors: Yimeng Li, Arnab Debnath, Gregory J. Stein, and Jana Kosecka
- Abstract要約: 我々は,最先端のDeep Reinforcement Learningに基づくアプローチと,ポイントゴールナビゲーション問題に対する部分観測可能なマルコフ決定プロセス(POMDP)の定式化を比較した。
私たちは、SOTA DD-PPOアプローチよりも若干パフォーマンスが劣るが、データが少ないことを示しています。
- 参考スコア(独自算出の注目度): 10.797100163772482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years several learning approaches to point goal navigation in
previously unseen environments have been proposed. They vary in the
representations of the environments, problem decomposition, and experimental
evaluation. In this work, we compare the state-of-the-art Deep Reinforcement
Learning based approaches with Partially Observable Markov Decision Process
(POMDP) formulation of the point goal navigation problem. We adapt the (POMDP)
sub-goal framework proposed by [1] and modify the component that estimates
frontier properties by using partial semantic maps of indoor scenes built from
images' semantic segmentation. In addition to the well-known completeness of
the model-based approach, we demonstrate that it is robust and efficient in
that it leverages informative, learned properties of the frontiers compared to
an optimistic frontier-based planner. We also demonstrate its data efficiency
compared to the end-to-end deep reinforcement learning approaches. We compare
our results against an optimistic planner, ANS and DD-PPO on Matterport3D
dataset using the Habitat Simulator. We show comparable, though slightly worse
performance than the SOTA DD-PPO approach, yet with far fewer data.
- Abstract(参考訳): 近年,未確認環境におけるゴールナビゲーションを指差す学習手法が提案されている。
それらは環境の表現、問題分解、実験的な評価によって異なる。
本研究では,最先端のDeep Reinforcement Learningに基づくアプローチと,ポイントゴールナビゲーション問題に対する部分観測可能なマルコフ決定プロセス(POMDP)を比較した。
本稿では,画像のセマンティックセグメンテーションから構築した屋内シーンのセマンティックマップを用いて,フロンティア特性を推定するコンポーネントを[1]で提案したサブゴールフレームワーク(POMDP)に適応させる。
モデルベースアプローチの周知の完全性に加えて、フロンティアの有益で学習された特性を楽観的なフロンティアベースのプランナーと比較して活用する上で、堅牢で効率的であることを実証する。
また,エンド・ツー・エンドの深層強化学習手法と比較して,そのデータ効率を示す。
本研究では,Habitat Simulator を用いた Matterport3D データセット上で,楽観的なプランナーである ANS と DD-PPO を比較した。
我々は、SOTA DD-PPOアプローチよりも若干パフォーマンスが劣るが、データが少ないことを示す。
関連論文リスト
- Volumetric Semantically Consistent 3D Panoptic Mapping [84.2638617094967]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Deep Active Ensemble Sampling For Image Classification [8.31483061185317]
アクティブラーニングフレームワークは、最も有益なデータポイントのラベル付けを積極的に要求することで、データアノテーションのコストを削減することを目的としている。
提案手法には、不確実性に基づく手法、幾何学的手法、不確実性に基づく手法と幾何学的手法の暗黙の組み合わせなどがある。
本稿では, サンプル選択戦略における効率的な探索・探索トレードオフを実現するために, 不確実性に基づくフレームワークと幾何学的フレームワークの両方の最近の進歩を革新的に統合する。
本フレームワークは,(1)正確な後続推定,(2)計算オーバーヘッドと高い精度のトレードオフの2つの利点を提供する。
論文 参考訳(メタデータ) (2022-10-11T20:20:20Z) - Joint Prediction of Monocular Depth and Structure using Planar and
Parallax Geometry [4.620624344434533]
教師付き学習深度推定法は、LiDARデータのような高品質な地上構造で訓練すると、優れた性能が得られる。
提案手法は,有望な平面とパララックス幾何学パイプラインの構造情報と深度情報を組み合わせたU-Net教師あり学習ネットワークの構築である。
我々のモデルは細い物体と縁の深さ予測に優れており、構造予測ベースラインと比較して、より頑健に機能する。
論文 参考訳(メタデータ) (2022-07-13T17:04:05Z) - Data Augmentation through Expert-guided Symmetry Detection to Improve
Performance in Offline Reinforcement Learning [0.0]
マルコフ決定過程(MDP)の動的モデルのオフライン推定は非自明な作業である。
近年の研究では、密度推定法に依存する専門家誘導パイプラインが、決定論的環境において、この構造を効果的に検出できることが示されている。
学習したMDPを解き、実際の環境に最適化されたポリシーを適用すると、前者の結果が性能改善につながることを示す。
論文 参考訳(メタデータ) (2021-12-18T14:32:32Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Densely Nested Top-Down Flows for Salient Object Detection [137.74130900326833]
本稿では,物体検出におけるトップダウンモデリングの役割を再考する。
密度の高いトップダウンフロー(DNTDF)ベースのフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
論文 参考訳(メタデータ) (2021-02-18T03:14:02Z) - Wasserstein Learning of Determinantal Point Processes [14.790452282691252]
本稿では,観測された部分集合からなるモデルとデータ間のワッサーシュタイン距離を最小化する新しいDPP学習手法を提案する。
MLEを用いて学習したDPPと比較して,我々のWasserstein学習アプローチは,生成タスクにおける予測性能を著しく向上させることを示した。
論文 参考訳(メタデータ) (2020-11-19T08:30:57Z) - Learnable Bernoulli Dropout for Bayesian Deep Learning [53.79615543862426]
Learnable Bernoulli Dropout (LBD) は、他のモデルパラメータと共に最適化されたパラメータとしてドロップアウト率を考慮する新しいモデルに依存しないドロップアウトスキームである。
LBDは画像分類とセマンティックセグメンテーションにおける精度と不確実性の推定を改善する。
論文 参考訳(メタデータ) (2020-02-12T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。