論文の概要: Disentangling Image Distortions in Deep Feature Space
- arxiv url: http://arxiv.org/abs/2002.11409v2
- Date: Tue, 16 Jun 2020 13:04:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 15:19:19.350972
- Title: Disentangling Image Distortions in Deep Feature Space
- Title(参考訳): 深部特徴空間における画像歪みの解消
- Authors: Simone Bianco, Luigi Celona, Paolo Napoletano
- Abstract要約: 我々は、深い視覚表現の能力を分析し、異なる種類の画像歪みを本質的に特徴付けることによって、知覚的類似性に対するより広い理解の方向への一歩を踏み出す。
与えられた層から抽出された特徴の次元還元表現により、特徴空間内の歪みのタイプを効率的に分離することができる。
各ネットワーク層は、異なるタイプの歪みを分離する異なる能力を示し、ネットワークアーキテクチャによってその能力は異なる。
- 参考スコア(独自算出の注目度): 20.220653544354285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous literature suggests that perceptual similarity is an emergent
property shared across deep visual representations. Experiments conducted on a
dataset of human-judged image distortions have proven that deep features
outperform classic perceptual metrics. In this work we take a further step in
the direction of a broader understanding of such property by analyzing the
capability of deep visual representations to intrinsically characterize
different types of image distortions. To this end, we firstly generate a number
of synthetically distorted images and then we analyze the features extracted by
different layers of different Deep Neural Networks. We observe that a
dimension-reduced representation of the features extracted from a given layer
permits to efficiently separate types of distortions in the feature space.
Moreover, each network layer exhibits a different ability to separate between
different types of distortions, and this ability varies according to the
network architecture. Finally, we evaluate the exploitation of features taken
from the layer that better separates image distortions for: i)
reduced-reference image quality assessment, and ii) distortion types and
severity levels characterization on both single and multiple distortion
databases. Results achieved on both tasks suggest that deep visual
representations can be unsupervisedly employed to efficiently characterize
various image distortions.
- Abstract(参考訳): 以前の文献では知覚的類似性は深い視覚表現に共通する創発的性質であることを示唆している。
人間の判断による画像歪みのデータセットで行った実験では、深い特徴が古典的な知覚的指標より優れていることが証明されている。
本研究では,様々な画像歪みを内在的に特徴付ける深層視覚表現の能力を解析することにより,そのような特性のより広い理解に向けてさらに一歩踏み出した。
この目的のために、まず複数の合成歪み画像を生成し、次に異なるディープニューラルネットワークの異なる層から抽出された特徴を解析する。
与えられた層から抽出した特徴の次元再現表現は,特徴空間内の歪みのタイプを効率的に分離することができる。
さらに、各ネットワーク層は、異なる種類の歪みを分離する異なる能力を示し、この能力は、ネットワークアーキテクチャによって異なる。
最後に、画像歪みをよりよく分離する層から取られた特徴の活用を評価します。
一 基準画像品質評価の低減及び
二 単一の歪みデータベース及び複数の歪みデータベースの歪みタイプ及び重症度の評価
両タスクで得られた結果は、様々な画像歪みを効率的に特徴付けるために、深い視覚表現を教師なしに使用できることを示唆している。
関連論文リスト
- Super Consistency of Neural Network Landscapes and Learning Rate Transfer [72.54450821671624]
我々は、失われたヘッセンのレンズを通して風景を研究する。
我々は、$mu$P のスペクトル特性がネットワークの大きさに大きく依存していることを発見した。
ニューラルタンジェントカーネル(NTK)や他のスケーリングシステムでは、シャープネスは異なるスケールで非常に異なるダイナミクスを示す。
論文 参考訳(メタデータ) (2024-02-27T12:28:01Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Do Different Deep Metric Learning Losses Lead to Similar Learned
Features? [4.043200001974071]
最近の研究では、14の事前学習モデルを比較し、すべてのモデルが同様に機能するにもかかわらず、異なる損失関数がモデルに異なる特徴を学習させることができることを発見した。
また,本分析の結果から,一見無関係な性質が埋没に重大な影響を及ぼす可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-05T15:07:19Z) - Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。
一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。
近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文 参考訳(メタデータ) (2021-05-10T19:00:49Z) - Projected Distribution Loss for Image Enhancement [15.297569497776374]
CNNアクティベーション間の1D-ワッサースタイン距離の集約は,既存の手法よりも信頼性が高いことを示す。
デノイジング、スーパーレゾリューション、復号化、デブレーション、JPEGアーティファクト除去などのイメージングアプリケーションでは、提案された学習損失は、参照ベースの知覚的損失に関する現在の最先端のものを上回る。
論文 参考訳(メタデータ) (2020-12-16T22:13:03Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - Restoring Spatially-Heterogeneous Distortions using Mixture of Experts
Network [11.048041466120589]
空間的不均一な歪みデータセットを導入し、各画像の異なる場所に複数の汚職を適用した。
マルチタスク学習によってモチベーションを得たネットワークは,共通表現と歪み表現の両方を学習する複数の経路を持つように設計されている。
我々のモデルは実世界の歪みの復元に有効であり、本手法が単一歪みと多重歪みの両方を管理するように設計された他のモデルよりも優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2020-09-30T11:06:38Z) - Exploring Intensity Invariance in Deep Neural Networks for Brain Image
Registration [0.0]
深層学習に基づく画像登録における入力画像対間の強度分布の影響について検討する。
構造的類似性に基づく損失をトレーニングしたディープラーニングモデルは、両方のデータセットでよりよく機能しているようだ。
論文 参考訳(メタデータ) (2020-09-21T17:49:03Z) - Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。
生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文 参考訳(メタデータ) (2020-07-20T18:04:14Z) - Disentangle Perceptual Learning through Online Contrastive Learning [16.534353501066203]
人間の視覚的知覚による現実的な結果の獲得は、画像変換タスクにおける中心的な関心事である。
本稿では,事前学習した分類ネットワークの特徴表現の中で,人間の視覚知覚に限定した次元しか関連していないことを論じる。
このような仮定の下で,提案したオンラインコントラスト学習を通じて,認識関連次元を表現から切り離そうとする。
論文 参考訳(メタデータ) (2020-06-24T06:48:38Z) - Shallow Feature Based Dense Attention Network for Crowd Counting [103.67446852449551]
静止画像から群衆を数えるためのShallow機能に基づくDense Attention Network (SDANet)を提案する。
提案手法は,SDANetの11.9%の平均絶対誤差(MAE)低下から明らかなように,既存の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2020-06-17T13:34:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。