論文の概要: What's Behind the Mask: Estimating Uncertainty in Image-to-Image
Problems
- arxiv url: http://arxiv.org/abs/2211.15211v1
- Date: Mon, 28 Nov 2022 10:41:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 16:34:51.383598
- Title: What's Behind the Mask: Estimating Uncertainty in Image-to-Image
Problems
- Title(参考訳): マスクの裏にあるもの:画像間問題における不確かさを推定する
- Authors: Gilad Kutiel, Regev Cohen, Michael Elad, Daniel Freedman
- Abstract要約: 画像間ネットワークの不確実性を推定することは重要な課題である。
マスキングに基づく新しい手法を提案する。
マスクを用いた画像カラー化,画像補完,超解像処理における不確実性の評価を行った。
- 参考スコア(独自算出の注目度): 29.55144604924458
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating uncertainty in image-to-image networks is an important task,
particularly as such networks are being increasingly deployed in the biological
and medical imaging realms. In this paper, we introduce a new approach to this
problem based on masking. Given an existing image-to-image network, our
approach computes a mask such that the distance between the masked
reconstructed image and the masked true image is guaranteed to be less than a
specified threshold, with high probability. The mask thus identifies the more
certain regions of the reconstructed image. Our approach is agnostic to the
underlying image-to-image network, and only requires triples of the input
(degraded), reconstructed and true images for training. Furthermore, our method
is agnostic to the distance metric used. As a result, one can use $L_p$-style
distances or perceptual distances like LPIPS, which contrasts with
interval-based approaches to uncertainty. Our theoretical guarantees derive
from a conformal calibration procedure. We evaluate our mask-based approach to
uncertainty on image colorization, image completion, and super-resolution
tasks, demonstrating high quality performance on each.
- Abstract(参考訳): イメージ・ツー・イメージ・ネットワークの不確実性を推定することは重要な課題であり、特にそのようなネットワークが生物学的・医学的な画像領域にますます展開されている。
本稿では,マスキングに基づくこの問題に対する新しいアプローチを提案する。
既存の画像画像ネットワークを前提として,マスク再構成画像とマスク真の画像との距離が一定の閾値未満であることを保証するマスクを高い確率で計算する。
したがって、マスクは再構成された画像のより特定の領域を特定する。
我々のアプローチは、基礎となるイメージ・ツー・イメージ・ネットワークとは無関係であり、トレーニングには入力(劣化)、再構成、真のイメージの3倍しか必要としない。
さらに,本手法は距離測定値と無関係である。
結果として、L_p$スタイルの距離やLPIPSのような知覚距離を使うことができる。
我々の理論的な保証は共形校正手順に由来する。
我々は,画像のカラー化,画像補完,超解像度タスクにおける不確実性に対するマスクベースアプローチを評価し,それぞれに高品質な性能を示す。
関連論文リスト
- Variance-insensitive and Target-preserving Mask Refinement for
Interactive Image Segmentation [68.16510297109872]
ポイントベースのインタラクティブなイメージセグメンテーションは、セマンティックセグメンテーションや画像編集といったアプリケーションにおけるマスクアノテーションの負担を軽減することができる。
本稿では,ユーザ入力の少ないセグメンテーション品質を向上する新しい手法である可変無感・ターゲット保存マスクリファインメントを提案する。
GrabCut、バークレー、SBD、DAVISデータセットの実験は、インタラクティブな画像セグメンテーションにおける我々の手法の最先端性能を実証している。
論文 参考訳(メタデータ) (2023-12-22T02:31:31Z) - On Mask-based Image Set Desensitization with Recognition Support [46.51027529020668]
マスクを用いた画像デセンシタイズ手法を提案する。
我々は,認識タスクの重要な情報を維持するために,解釈アルゴリズムを利用する。
また,マスク画像に基づく性能向上のためのモデル調整手法として,特徴選択マスクネットを提案する。
論文 参考訳(メタデータ) (2023-12-14T14:26:42Z) - DPPMask: Masked Image Modeling with Determinantal Point Processes [49.65141962357528]
Masked Image Modeling (MIM)は、ランダムにマスキングされた画像の再構成を目的として、印象的な代表的性能を達成した。
先行研究で広く使われている一様ランダムマスキングは、必然的にいくつかの重要なオブジェクトを失い、元のセマンティック情報を変更する。
この問題に対処するため、MIMを新しいマスキング戦略であるDPPMaskで強化する。
提案手法は単純だが有効であり,様々なフレームワークで実装される場合,余分に学習可能なパラメータは不要である。
論文 参考訳(メタデータ) (2023-03-13T13:40:39Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - OLED: One-Class Learned Encoder-Decoder Network with Adversarial Context
Masking for Novelty Detection [1.933681537640272]
新規性検出は、対象クラスの分布に属さないサンプルを認識するタスクである。
ディープオートエンコーダは多くの教師なしのノベルティ検出法のベースとして広く使われている。
我々は,MaskモジュールとReconstructorという2つの競合するネットワークからなるフレームワークを設計した。
論文 参考訳(メタデータ) (2021-03-27T17:59:40Z) - TextureWGAN: Texture Preserving WGAN with MLE Regularizer for Inverse
Problems [4.112614964808275]
提案手法の中で最も一般的で効果的な方法は平均二乗誤差(MSE)を持つ畳み込みニューラルネットワーク(CNN)である。
逆問題に対するWGAN(Wasserstein GAN)に基づく新しい手法を提案する。
We showed that the WGAN-based method was effective to maintain image texture, it also also used a maximum max estimation regularizer (MLE) to maintain pixel fidelity。
論文 参考訳(メタデータ) (2020-08-11T17:06:34Z) - R-MNet: A Perceptual Adversarial Network for Image Inpainting [5.471225956329675]
本稿では,新たな逆マスク演算子であるReverse Masking Network(R-MNet)と組み合わせたWasserstein GANを提案する。
提案手法は,高分解能な塗装作業に一般化でき,人間の視覚系に適応可能なよりリアルな出力を示す。
論文 参考訳(メタデータ) (2020-08-11T10:58:10Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。