論文の概要: Bayesian deep learning of affordances from RGB images
- arxiv url: http://arxiv.org/abs/2109.12845v1
- Date: Mon, 27 Sep 2021 07:39:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:14:29.514479
- Title: Bayesian deep learning of affordances from RGB images
- Title(参考訳): RGB画像を用いたベイズ深層学習
- Authors: Lorenzo Mur-Labadia and Ruben Martinez-Cantin
- Abstract要約: 本稿では,RGB画像から直接,環境の可利用性を予測するための深層学習手法を提案する。
社会的に受け入れられた価格に関するこれまでの研究に基づいて,本モデルでは,対象物と全画像の局所的・グローバル的情報を組み合わせたマルチスケールCNNをベースとした。
以上の結果から,Brierスコアと予測誤差のMC-dropoutと比較すると,深層アンサンブルの限界性能が向上した。
- 参考スコア(独自算出の注目度): 5.939410304994348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous agents, such as robots or intelligent devices, need to understand
how to interact with objects and its environment. Affordances are defined as
the relationships between an agent, the objects, and the possible future
actions in the environment. In this paper, we present a Bayesian deep learning
method to predict the affordances available in the environment directly from
RGB images. Based on previous work on socially accepted affordances, our model
is based on a multiscale CNN that combines local and global information from
the object and the full image. However, previous works assume a deterministic
model, but uncertainty quantification is fundamental for robust detection,
affordance-based reason, continual learning, etc. Our Bayesian model is able to
capture both the aleatoric uncertainty from the scene and the epistemic
uncertainty associated with the model and previous learning process. For
comparison, we estimate the uncertainty using two state-of-the-art techniques:
Monte Carlo dropout and deep ensembles. We also compare different types of CNN
encoders for feature extraction. We have performed several experiments on an
affordance database on socially acceptable behaviours and we have shown
improved performance compared with previous works. Furthermore, the uncertainty
estimation is consistent with the the type of objects and scenarios. Our
results show a marginal better performance of deep ensembles, compared to
MC-dropout on the Brier score and the Expected Calibration Error.
- Abstract(参考訳): ロボットやインテリジェントデバイスのような自律エージェントは、オブジェクトとその環境とのインタラクション方法を理解する必要がある。
Affordancesはエージェント、オブジェクト、および環境における将来のアクションの間の関係として定義される。
本稿では,RGB画像から直接,環境の可利用性を予測するためのベイズ深層学習手法を提案する。
社会的に受け入れられた価格に関するこれまでの研究に基づいて,対象物と全画像の局所的・グローバル的情報を組み合わせたマルチスケールCNNをモデルとした。
しかしながら、以前の研究では決定論的モデルが想定されているが、不確実性定量化はロバストな検出、アフォーマンスに基づく推論、継続的な学習などの基本である。
ベイズモデルでは, 現場からの照会的不確実性と, モデルと過去の学習過程に関連する認識的不確実性の両方を捉えることができる。
比較のために,モンテカルロのドロップアウトとディープアンサンブルという2つの最先端技術を用いて不確実性を推定する。
また,特徴抽出のために異なるタイプのCNNエンコーダを比較する。
我々は,社会的に許容される行動について,手頃なデータベース上でいくつかの実験を行った。
さらに、不確実性推定は、オブジェクトのタイプやシナリオと一致している。
以上の結果から,Brierスコアと期待校正誤差のMC-dropoutと比較すると,深層アンサンブルの限界性能が向上した。
関連論文リスト
- Gaussian Mixture Models for Affordance Learning using Bayesian Networks [50.18477618198277]
Affordancesはアクション、オブジェクト、エフェクト間の関係の基本的な記述である。
本稿では,世界を探究し,その感覚経験から自律的にこれらの余裕を学習するエンボディエージェントの問題にアプローチする。
論文 参考訳(メタデータ) (2024-02-08T22:05:45Z) - From Reactive to Proactive Volatility Modeling with Hemisphere Neural Networks [0.0]
我々は,新しいニューラルネットワークアーキテクチャを用いて,マクロ経済密度予測のための最大推定値(MLE)を再活性化する。
ヘミスフィアニューラルネットワーク(HNN)は、可能時の主指標に基づく積極的なボラティリティ予測と、必要時の過去の予測誤差の大きさに基づく反応性ボラティリティ予測を提供する。
論文 参考訳(メタデータ) (2023-11-27T21:37:50Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - PRISM: Probabilistic Real-Time Inference in Spatial World Models [52.878769723544615]
PRISMはエージェントの動きと視覚知覚の確率的生成モデルにおけるリアルタイムフィルタリングの手法である。
提案手法は10Hzでリアルタイムに動作し,小型・中型屋内環境における最先端SLAMと同等に精度が高い。
論文 参考訳(メタデータ) (2022-12-06T13:59:06Z) - MDN-VO: Estimating Visual Odometry with Confidence [34.8860186009308]
視覚オドメトリー(VO)は、ロボット工学や自律システムを含む多くのアプリケーションで使われている。
本研究では、6-DoFのポーズを推定する深層学習に基づくVOモデルと、これらの推定に対する信頼度モデルを提案する。
本実験は,本モデルが故障事例の検出に加えて,最先端の性能を上回ることを示す。
論文 参考訳(メタデータ) (2021-12-23T19:26:04Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Towards Robust Object Detection: Bayesian RetinaNet for Homoscedastic
Aleatoric Uncertainty Modeling [1.6500749121196985]
COCOデータセットは、データラベルの高レベルのノイズで知られている。
本稿では,画像オブジェクト検出の大規模化に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2021-08-02T11:03:39Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - A Novel Regression Loss for Non-Parametric Uncertainty Optimization [7.766663822644739]
不確実性の定量化は、安全な機械学習を確立する最も有望なアプローチの1つである。
これまでの最も一般的なアプローチの1つはモンテカルロドロップアウトで、計算量的に安価で、実際に簡単に適用できる。
この問題に対処するため,第2モーメント損失(UCI)と呼ばれる新たな目標を提案する。
論文 参考訳(メタデータ) (2021-01-07T19:12:06Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。