論文の概要: Uncertainty Inspired RGB-D Saliency Detection
- arxiv url: http://arxiv.org/abs/2009.03075v1
- Date: Mon, 7 Sep 2020 13:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 03:05:52.702021
- Title: Uncertainty Inspired RGB-D Saliency Detection
- Title(参考訳): 不確かさにインスパイアされたRGB-D濃度検出
- Authors: Jing Zhang, Deng-Ping Fan, Yuchao Dai, Saeed Anwar, Fatemeh Saleh,
Sadegh Aliakbarian, Nick Barnes
- Abstract要約: 本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
- 参考スコア(独自算出の注目度): 70.50583438784571
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose the first stochastic framework to employ uncertainty for RGB-D
saliency detection by learning from the data labeling process. Existing RGB-D
saliency detection models treat this task as a point estimation problem by
predicting a single saliency map following a deterministic learning pipeline.
We argue that, however, the deterministic solution is relatively ill-posed.
Inspired by the saliency data labeling process, we propose a generative
architecture to achieve probabilistic RGB-D saliency detection which utilizes a
latent variable to model the labeling variations. Our framework includes two
main models: 1) a generator model, which maps the input image and latent
variable to stochastic saliency prediction, and 2) an inference model, which
gradually updates the latent variable by sampling it from the true or
approximate posterior distribution. The generator model is an encoder-decoder
saliency network. To infer the latent variable, we introduce two different
solutions: i) a Conditional Variational Auto-encoder with an extra encoder to
approximate the posterior distribution of the latent variable; and ii) an
Alternating Back-Propagation technique, which directly samples the latent
variable from the true posterior distribution. Qualitative and quantitative
results on six challenging RGB-D benchmark datasets show our approach's
superior performance in learning the distribution of saliency maps. The source
code is publicly available via our project page:
https://github.com/JingZhang617/UCNet.
- Abstract(参考訳): データラベリングプロセスから学習することで,RGB-Dサリエンシ検出の不確実性を活用するための最初の確率的フレームワークを提案する。
既存のRGB-Dサリエンシ検出モデルは、決定論的学習パイプラインに従って単一のサリエンシマップを予測することにより、このタスクをポイント推定問題として扱う。
しかし、決定論的解は比較的不適切であると主張する。
本稿では,ラベル付けのバリエーションをモデル化する潜在変数を用いた確率的RGB-Dサリエンシ検出を実現するための生成アーキテクチャを提案する。
私たちのフレームワークには2つの主要なモデルがあります。
1)入力画像と潜在変数を確率的塩分予測にマッピングする生成モデル,及び
2) 後続変数を真あるいは近似的な後続分布からサンプリングすることにより, 潜時変数を徐々に更新する推論モデル。
ジェネレータモデルはエンコーダ・デコーダ・サリエンシネットワークである。
潜在変数を推測するために、2つの異なる解を導入する。
一 潜伏変数の後方分布を近似する余分なエンコーダを有する条件付き変分自動エンコーダ
二 真の後方分布から潜在変数を直接サンプリングする交互なバックプロパゲーション技術
6つの挑戦的RGB-Dベンチマークデータセットの質的および定量的結果は、我々のアプローチが唾液度マップの分布を学習する際の優れた性能を示している。
ソースコードは、プロジェクトのページから公開されています。
関連論文リスト
- Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.7704032792820767]
ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T09:47:29Z) - An Energy-Based Prior for Generative Saliency [62.79775297611203]
本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
実験結果から, エネルギーベース先行モデルを用いた生成塩分率モデルでは, 精度の高い塩分率予測だけでなく, 人間の知覚と整合した信頼性の高い不確実性マップを実現できることが示された。
論文 参考訳(メタデータ) (2022-04-19T10:51:00Z) - Performance of Bayesian linear regression in a model with mismatch [8.60118148262922]
本研究では,ガウス先行の対数対数対のベイズ分布の平均値から得られる推定器の性能を解析した。
この推論モデルは、スピングラスにおけるガードナーモデルのバージョンとして記述することができる。
論文 参考訳(メタデータ) (2021-07-14T18:50:13Z) - Visual Saliency Transformer [127.33678448761599]
RGBとRGB-Dの液状物体検出(SOD)のための、純粋な変圧器であるVST(Visual Saliency Transformer)に基づく新しい統一モデルを開発しました。
イメージパッチを入力として取り、トランスフォーマーを利用してイメージパッチ間のグローバルコンテキストを伝搬する。
実験結果から,RGBとRGB-D SODのベンチマークデータセットにおいて,本モデルが既存の最新結果を上回っていることが示された。
論文 参考訳(メタデータ) (2021-04-25T08:24:06Z) - Score-Based Generative Modeling through Stochastic Differential
Equations [114.39209003111723]
複素データ分布を雑音を注入することによって既知の事前分布に変換する微分方程式を提案する。
対応する逆時間SDEは、ノイズを緩やかに除去し、先行分布をデータ分布に戻す。
スコアベース生成モデリングの進歩を活用することで、これらのスコアをニューラルネットワークで正確に推定することができる。
スコアベース生成モデルから1024×1024画像の高忠実度生成を初めて示す。
論文 参考訳(メタデータ) (2020-11-26T19:39:10Z) - CQ-VAE: Coordinate Quantized VAE for Uncertainty Estimation with
Application to Disk Shape Analysis from Lumbar Spine MRI Images [1.5841288368322592]
本稿では,あいまいさの表現を学習し,確率的出力を生成するための強力な生成モデルを提案する。
我々のモデルは、CQ-VAE (Coordinate Quantization Variational Autoencoder) と呼ばれ、内部の離散確率分布を持つ離散潜在空間を用いている。
マッチングアルゴリズムを用いて、モデル生成サンプルと「地下構造」サンプルの対応性を確立する。
論文 参考訳(メタデータ) (2020-10-17T04:25:32Z) - Learning Noise-Aware Encoder-Decoder from Noisy Labels by Alternating
Back-Propagation for Saliency Detection [54.98042023365694]
本稿では,ノイズを考慮したエンコーダ・デコーダ・フレームワークを提案する。
提案モデルはニューラルネットワークによってパラメータ化された2つのサブモデルから構成される。
論文 参考訳(メタデータ) (2020-07-23T18:47:36Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。