論文の概要: Image Quality Assessment: Unifying Structure and Texture Similarity
- arxiv url: http://arxiv.org/abs/2004.07728v3
- Date: Wed, 16 Dec 2020 12:56:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 21:56:47.959553
- Title: Image Quality Assessment: Unifying Structure and Texture Similarity
- Title(参考訳): 画像品質評価 : 構造とテクスチャの類似性の統合
- Authors: Keyan Ding, Kede Ma, Shiqi Wang, and Eero P. Simoncelli
- Abstract要約: テクスチャリサンプリングに対する耐性を明示した,最初のフル参照画像品質モデルを開発した。
畳み込みニューラルネットワークを用いて、画像をオーバーコンプリート表現に変換するインジェクティブで微分可能な関数を構築する。
- 参考スコア(独自算出の注目度): 38.05659069533254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective measures of image quality generally operate by comparing pixels of
a "degraded" image to those of the original. Relative to human observers, these
measures are overly sensitive to resampling of texture regions (e.g., replacing
one patch of grass with another). Here, we develop the first full-reference
image quality model with explicit tolerance to texture resampling. Using a
convolutional neural network, we construct an injective and differentiable
function that transforms images to multi-scale overcomplete representations. We
demonstrate empirically that the spatial averages of the feature maps in this
representation capture texture appearance, in that they provide a set of
sufficient statistical constraints to synthesize a wide variety of texture
patterns. We then describe an image quality method that combines correlations
of these spatial averages ("texture similarity") with correlations of the
feature maps ("structure similarity"). The parameters of the proposed measure
are jointly optimized to match human ratings of image quality, while minimizing
the reported distances between subimages cropped from the same texture images.
Experiments show that the optimized method explains human perceptual scores,
both on conventional image quality databases, as well as on texture databases.
The measure also offers competitive performance on related tasks such as
texture classification and retrieval. Finally, we show that our method is
relatively insensitive to geometric transformations (e.g., translation and
dilation), without use of any specialized training or data augmentation. Code
is available at https://github.com/dingkeyan93/DISTS.
- Abstract(参考訳): 画質の客観的測定は、一般に「劣化した」画像の画素と原画像の画素を比較して行われる。
人間の観察者に対して、これらの尺度はテクスチャ領域の再サンプリング(例えば、草のパッチを別のパッチに置き換える)に対して過度に敏感である。
本稿では,テクスチャ再サンプリングへの耐性を明示した,最初のフルリファレンス画像品質モデルを開発した。
畳み込みニューラルネットワークを用いて,画像から多スケールの超完全表現へ変換するインジェクティブかつ微分可能な関数を構築する。
この表現における特徴マップの空間平均は,多様なテクスチャパターンを合成するのに十分な統計的制約をセットとして提供できることを実証的に示す。
次に,これらの空間平均の相関関係(テクスチャ類似度)と特徴マップの相関関係(構造類似度)を組み合わせた画質手法について述べる。
提案手法のパラメータは,同じテクスチャ画像から抽出したサブイメージ間の報告された距離を最小化しながら,画像品質の人間の評価に適合するように共同最適化される。
実験の結果,従来の画像品質データベースとテクスチャデータベースの両方で,人間の知覚スコアを最適化した手法が説明できた。
この尺度はまた、テクスチャ分類や検索といった関連するタスクの競合性能も提供する。
最後に, この手法は, 特殊なトレーニングやデータ拡張を使わずに, 幾何変換(例えば, 翻訳や拡張)に比較的敏感であることを示す。
コードはhttps://github.com/dingkeyan93/DISTSで入手できる。
関連論文リスト
- CSIM: A Copula-based similarity index sensitive to local changes for Image quality assessment [2.3874115898130865]
画像類似度メトリクスは、画像処理、コンピュータビジョン、機械学習で使用されるため、コンピュータビジョンアプリケーションにおいて重要な役割を果たす。
PSNR、MSE、SSIM、ISSM、FSIMといった既存のメトリクスは、画像の小さな変更に対する速度、複雑さ、感度のいずれにおいても制限に直面していることが多い。
本稿では,画像の微妙な変化に敏感でありながらリアルタイムに組み合わせた新しい画像類似度指標CSIMについて検討する。
論文 参考訳(メタデータ) (2024-10-02T10:46:05Z) - The applicability of transperceptual and deep learning approaches to the
study and mimicry of complex cartilaginous tissues [0.0]
複雑な軟組織、例えば膝半月板は、移動と関節の健康において重要な役割を担っている。
組織を設計するためには、組織の内部構造を理解して複製する必要がある。
私たちは、ネイティブなアーキテクチャを模倣する人工アーキテクチャを生成するために、オーディオと視覚を組み合わせたアプローチ、いわゆるトランスパーセプティカル(transperceptual)を探求します。
論文 参考訳(メタデータ) (2022-11-21T08:51:52Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Multiscale Analysis for Improving Texture Classification [62.226224120400026]
本稿では,テクスチャの異なる空間周波数帯域を別々に扱うために,ガウス・ラプラシアピラミッドを用いる。
バイオインスパイアされたテクスチャ記述子,情報理論測度,灰色レベルの共起行列特徴,ハリリック統計特徴から抽出した特徴を特徴ベクトルに集約した。
論文 参考訳(メタデータ) (2022-04-21T01:32:22Z) - Locally Adaptive Structure and Texture Similarity for Image Quality
Assessment [33.58928017067797]
フル参照画像品質評価(IQA)のための局所適応構造とテクスチャ類似度指標について述べる。
具体的には、異なるスケールでテクスチャ領域をローカライズするために、分散指数と呼ばれる単一の統計的特徴に依存する。
その結果、A-DISTSは局所的な画像コンテンツに適応し、教師付きトレーニングのための高価な人間の知覚スコアを欠いている。
論文 参考訳(メタデータ) (2021-10-16T09:19:56Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Image Inpainting Guided by Coherence Priors of Semantics and Textures [62.92586889409379]
セマンティクスとテクスチャ間のコヒーレンスプリエンスを導入することにより、セマンティクス的な方法で別々のテクスチャを完成させることに集中できる。
また,全体構造と詳細なテクスチャの観点から,セマンティクスとインペインテッドイメージの一貫性を制約する2つのコヒーレンス損失を提案する。
論文 参考訳(メタデータ) (2020-12-15T02:59:37Z) - Texture image classification based on a pseudo-parabolic diffusion model [0.0]
提案手法は、確立されたベンチマークテクスチャデータベースの分類と、植物種認識の実践的な課題について検証する。
画像の同種領域内では、擬似放物的演算子が、うる限りノイズの多い詳細を滑らかにすることができることで、優れた性能を大いに正当化することができる。
論文 参考訳(メタデータ) (2020-11-14T00:04:07Z) - Learning Texture Invariant Representation for Domain Adaptation of
Semantic Segmentation [19.617821473205694]
合成データで訓練されたモデルが実際のデータに一般化することは困難である。
我々はスタイル伝達アルゴリズムを用いて合成画像のテクスチャを多様性する。
我々は、ターゲットテクスチャを直接監視するために、自己学習でモデルを微調整する。
論文 参考訳(メタデータ) (2020-03-02T13:11:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。