論文の概要: Bayesian Deep Learning for Affordance Segmentation in images
- arxiv url: http://arxiv.org/abs/2303.00871v1
- Date: Thu, 2 Mar 2023 00:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 16:48:20.505262
- Title: Bayesian Deep Learning for Affordance Segmentation in images
- Title(参考訳): 画像中のアフォーマンスセグメンテーションのためのベイズ深層学習
- Authors: Lorenzo Mur-Labadia, Ruben Martinez-Cantin and Jose J. Guerrero
- Abstract要約: 本稿では,画像の空き地を検出するための新しいベイズディープネットワークを提案する。
空間レベルでの動脈およびてんかんの分布を定量化する。
その結果,決定論的ネットワークの最先端性が向上した。
- 参考スコア(独自算出の注目度): 3.15834651147911
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Affordances are a fundamental concept in robotics since they relate available
actions for an agent depending on its sensory-motor capabilities and the
environment. We present a novel Bayesian deep network to detect affordances in
images, at the same time that we quantify the distribution of the aleatoric and
epistemic variance at the spatial level. We adapt the Mask-RCNN architecture to
learn a probabilistic representation using Monte Carlo dropout. Our results
outperform the state-of-the-art of deterministic networks. We attribute this
improvement to a better probabilistic feature space representation on the
encoder and the Bayesian variability induced at the mask generation, which
adapts better to the object contours. We also introduce the new
Probability-based Mask Quality measure that reveals the semantic and spatial
differences on a probabilistic instance segmentation model. We modify the
existing Probabilistic Detection Quality metric by comparing the binary masks
rather than the predicted bounding boxes, achieving a finer-grained evaluation
of the probabilistic segmentation. We find aleatoric variance in the contours
of the objects due to the camera noise, while epistemic variance appears in
visual challenging pixels.
- Abstract(参考訳): ロボット工学の基本的な概念は、感覚運動能力と環境に応じてエージェントが利用可能な動作を関連付けるためである。
本研究では,画像中のアリーマンスを検出するための新しいベイズ深層ネットワークを提案すると同時に,空間レベルでのアリーエータと認識的分散の分布を定量化する。
mask-rcnnアーキテクチャを適用し,モンテカルロドロップアウトを用いた確率的表現を学習する。
我々の結果は決定論的ネットワークの最先端を上回っている。
この改善は、エンコーダ上のより確率的な特徴空間表現と、マスク生成によって誘導されるベイズ変量により、オブジェクトの輪郭に適応する。
また,確率的インスタンスセグメンテーションモデルにおける意味的・空間的差異を明らかにする新しい確率ベースマスク品質尺度を提案する。
予測された境界ボックスよりもバイナリマスクを比較し,確率的セグメント化をより詳細に評価することで,既存の確率的検出品質指標を修正した。
カメラノイズによる物体の輪郭のアレータリックなばらつきは, 視覚的困難画素に現れるが, エピステマティックなばらつきは現れない。
関連論文リスト
- FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.195642571004804]
署名された距離関数(SDF)を表す画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを提案する。
SDFの条件分布の確率パスに直接関係するベクトル場を学習することにより、セグメント化マスクの分布から正確にサンプリングすることができる。
論文 参考訳(メタデータ) (2024-05-28T11:47:12Z) - Gaussian Mixture Models for Affordance Learning using Bayesian Networks [50.18477618198277]
Affordancesはアクション、オブジェクト、エフェクト間の関係の基本的な記述である。
本稿では,世界を探究し,その感覚経験から自律的にこれらの余裕を学習するエンボディエージェントの問題にアプローチする。
論文 参考訳(メタデータ) (2024-02-08T22:05:45Z) - Pre-training with Random Orthogonal Projection Image Modeling [32.667183132025094]
Masked Image Modeling (MIM)は、ラベルを使わずに視覚前訓練のための強力な自己教師型戦略である。
ランダム直交投影画像モデリング(ROPIM)に基づく画像モデリングフレームワークを提案する。
ROPIMはノイズ分散が保証される場合の空間的トークン情報を低減し、局所的に変化するマスキング度の下で空間的画像領域全体をマスキングすると見なすことができる。
論文 参考訳(メタデータ) (2023-10-28T15:42:07Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Analysis of convolutional neural network image classifiers in a
rotationally symmetric model [4.56877715768796]
最適誤分類リスクに対する推定の誤分類リスクの収束率を分析する。
畳み込みニューラルネットワークに基づく最小二乗プラグイン分類器は、二元画像分類における次元性の呪いを回避できることが示されている。
論文 参考訳(メタデータ) (2022-05-11T13:43:13Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with
Application to Disk Shape Analysis from Lumbar Spine MRI Images [1.5841288368322592]
本稿では,あいまいさの表現を学習し,確率的出力を生成するための強力な生成モデルを提案する。
我々のモデルは、CQ-VAE (Coordinate Quantization Variational Autoencoder) と呼ばれ、内部の離散確率分布を持つ離散潜在空間を用いている。
マッチングアルゴリズムを用いて、モデル生成サンプルと「地下構造」サンプルの対応性を確立する。
論文 参考訳(メタデータ) (2020-10-17T04:25:32Z) - Stochastic Segmentation Networks: Modelling Spatially Correlated
Aleatoric Uncertainty [32.33791302617957]
画像セグメンテーションネットワークアーキテクチャを用いてアレータティック不確実性をモデル化するための効率的な確率的手法であるセグメンテーションネットワーク(SSN)を導入する。
SSNは単一の画像に対して複数の空間的コヒーレント仮説を生成することができる。
2次元CTでは肺結節,3次元MRIでは脳腫瘍を含む実世界の医療データのセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-10T18:06:41Z) - Multi-Granularity Canonical Appearance Pooling for Remote Sensing Scene
Classification [0.34376560669160383]
リモートセンシングデータセットの潜在存在論的構造を自動的に捉えるために,新しいMG-CAP(Multi-Granularity Canonical Appearance Pooling)を提案する。
それぞれの特定の粒度に対して,事前定義された変換の集合から標準的外観を発見し,最大化に基づくシームズスタイルアーキテクチャを用いて対応するCNN特徴を学習する。
本稿では,GPUの固有値分解関数(EIG)を学習し,行列計算によるバックプロパゲーションを実証する安定解を提案する。
論文 参考訳(メタデータ) (2020-04-09T11:24:00Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。