論文の概要: UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2004.05763v1
- Date: Mon, 13 Apr 2020 04:12:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:00:53.561683
- Title: UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders
- Title(参考訳): UC-Net:条件変分オートエンコーダによる不確実なRGB-D濃度検出
- Authors: Jing Zhang, Deng-Ping Fan, Yuchao Dai, Saeed Anwar, Fatemeh Sadat
Saleh, Tong Zhang, Nick Barnes
- Abstract要約: データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
- 参考スコア(独自算出の注目度): 81.5490760424213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose the first framework (UCNet) to employ uncertainty
for RGB-D saliency detection by learning from the data labeling process.
Existing RGB-D saliency detection methods treat the saliency detection task as
a point estimation problem, and produce a single saliency map following a
deterministic learning pipeline. Inspired by the saliency data labeling
process, we propose probabilistic RGB-D saliency detection network via
conditional variational autoencoders to model human annotation uncertainty and
generate multiple saliency maps for each input image by sampling in the latent
space. With the proposed saliency consensus process, we are able to generate an
accurate saliency map based on these multiple predictions. Quantitative and
qualitative evaluations on six challenging benchmark datasets against 18
competing algorithms demonstrate the effectiveness of our approach in learning
the distribution of saliency maps, leading to a new state-of-the-art in RGB-D
saliency detection.
- Abstract(参考訳): 本稿では,データラベリングプロセスから学習することで,RGB-Dサリエンシ検出の不確実性を利用した最初のフレームワーク(UCNet)を提案する。
既存のRGB-Dサリエンシ検出手法は、サリエンシ検出タスクをポイント推定問題として扱い、決定論的学習パイプラインに従って単一のサリエンシマップを生成する。
そこで本研究では,人間の不確かさをモデル化するための条件付き変分自動エンコーダを用いた確率的RGB-Dサリエンシ検出ネットワークを提案し,潜時空間にサンプリングすることで,各入力画像に対して複数のサリエンシマップを生成する。
提案手法では,これらの複数の予測に基づいて正確な塩分分布図を生成することができる。
18のアルゴリズムに対する6つの挑戦的ベンチマークデータセットの量的・質的評価は、サリエンシーマップの分布を学習する手法の有効性を示し、rgb-dサリエンシー検出の新たな最先端につながった。
関連論文リスト
- RGB-D based Stair Detection using Deep Learning for Autonomous Stair
Climbing [6.362951673024623]
本稿では,RGBマップと深度マップの両方の入力を持つニューラルネットワークアーキテクチャを提案する。
具体的には,RGBマップと深度マップの相補関係をネットワークが学習できるように,選択モジュールを設計する。
提案手法は,従来の最先端深層学習法と比較して精度の向上とリコールが可能であることを示す。
論文 参考訳(メタデータ) (2022-12-02T11:22:52Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z) - Towards End-to-end Car License Plate Location and Recognition in
Unconstrained Scenarios [0.0]
ライセンスプレートの検出と認識を同時に行うための効率的なフレームワークを提案する。
軽量で統一されたディープニューラルネットワークで、エンドツーエンドに最適化され、リアルタイムに動作する。
実験結果から,提案手法は従来の最先端手法よりも高速・高精度で優れていたことが示唆された。
論文 参考訳(メタデータ) (2020-08-25T09:51:33Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z) - Unsupervised Domain Adaptation through Inter-modal Rotation for RGB-D
Object Recognition [31.24587317555857]
本稿では,RGBと深度画像のモーダル間関係を利用して,合成領域から実領域へのシフトを低減する新しいRGB-D DA法を提案する。
提案手法は,主認識タスクに加えて,RGBと深度画像の相対的回転を予測するプリテキストタスクである畳み込みニューラルネットワークを訓練することで解決する。
論文 参考訳(メタデータ) (2020-04-21T13:53:55Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。