論文の概要: UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2004.05763v1
- Date: Mon, 13 Apr 2020 04:12:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 00:00:53.561683
- Title: UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders
- Title(参考訳): UC-Net:条件変分オートエンコーダによる不確実なRGB-D濃度検出
- Authors: Jing Zhang, Deng-Ping Fan, Yuchao Dai, Saeed Anwar, Fatemeh Sadat
Saleh, Tong Zhang, Nick Barnes
- Abstract要約: データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
- 参考スコア(独自算出の注目度): 81.5490760424213
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose the first framework (UCNet) to employ uncertainty
for RGB-D saliency detection by learning from the data labeling process.
Existing RGB-D saliency detection methods treat the saliency detection task as
a point estimation problem, and produce a single saliency map following a
deterministic learning pipeline. Inspired by the saliency data labeling
process, we propose probabilistic RGB-D saliency detection network via
conditional variational autoencoders to model human annotation uncertainty and
generate multiple saliency maps for each input image by sampling in the latent
space. With the proposed saliency consensus process, we are able to generate an
accurate saliency map based on these multiple predictions. Quantitative and
qualitative evaluations on six challenging benchmark datasets against 18
competing algorithms demonstrate the effectiveness of our approach in learning
the distribution of saliency maps, leading to a new state-of-the-art in RGB-D
saliency detection.
- Abstract(参考訳): 本稿では,データラベリングプロセスから学習することで,RGB-Dサリエンシ検出の不確実性を利用した最初のフレームワーク(UCNet)を提案する。
既存のRGB-Dサリエンシ検出手法は、サリエンシ検出タスクをポイント推定問題として扱い、決定論的学習パイプラインに従って単一のサリエンシマップを生成する。
そこで本研究では,人間の不確かさをモデル化するための条件付き変分自動エンコーダを用いた確率的RGB-Dサリエンシ検出ネットワークを提案し,潜時空間にサンプリングすることで,各入力画像に対して複数のサリエンシマップを生成する。
提案手法では,これらの複数の予測に基づいて正確な塩分分布図を生成することができる。
18のアルゴリズムに対する6つの挑戦的ベンチマークデータセットの量的・質的評価は、サリエンシーマップの分布を学習する手法の有効性を示し、rgb-dサリエンシー検出の新たな最先端につながった。
関連論文リスト
- Reproduction of scan B-statistic for kernel change-point detection algorithm [10.49860279555873]
変化点検出は、幅広い応用のために大きな注目を集めている。
本稿では,カーネルベースの効率的なスキャンB統計に基づくオンライン変更点検出アルゴリズムを最近提案した。
数値実験により, 走査型B統計が常に優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-08-23T15:12:31Z) - Learning for Transductive Threshold Calibration in Open-World Recognition [83.35320675679122]
グラフニューラルネットワークを用いた高剛性と適応性を有するトランスダクティブしきい値キャリブレーション法であるOpenGCNを導入する。
オープンワールドの視覚認識ベンチマークにおける実験は、オープンワールドのしきい値校正のための既存のポストホック校正方法よりもOpenGCNの方が優れていることを検証する。
論文 参考訳(メタデータ) (2023-05-19T23:52:48Z) - Probing the Purview of Neural Networks via Gradient Analysis [13.800680101300756]
我々は、ニューラルネットワークのデータ依存能力を分析し、推論中のネットワークの観点から入力の異常を評価する。
ネットワークのパービューを探索するために、モデルに必要な変化量を測定するために勾配を利用して、与えられた入力をより正確に特徴付ける。
我々の勾配に基づくアプローチは、学習した特徴で正確に表現できない入力を効果的に区別できることを実証する。
論文 参考訳(メタデータ) (2023-04-06T03:02:05Z) - Unsupervised Spike Depth Estimation via Cross-modality Cross-domain Knowledge Transfer [53.413305467674434]
スパイク深度推定をサポートするためにオープンソースのRGBデータを導入し,そのアノテーションと空間情報を活用する。
教師なしスパイク深さ推定を実現するために,クロスモーダルクロスドメイン(BiCross)フレームワークを提案する。
提案手法は,RGB指向の教師なし深度推定法と比較して,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-08-26T09:35:20Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z) - Unsupervised Domain Adaptation through Inter-modal Rotation for RGB-D
Object Recognition [31.24587317555857]
本稿では,RGBと深度画像のモーダル間関係を利用して,合成領域から実領域へのシフトを低減する新しいRGB-D DA法を提案する。
提案手法は,主認識タスクに加えて,RGBと深度画像の相対的回転を予測するプリテキストタスクである畳み込みニューラルネットワークを訓練することで解決する。
論文 参考訳(メタデータ) (2020-04-21T13:53:55Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。