論文の概要: (ASNA) An Attention-based Siamese-Difference Neural Network with
Surrogate Ranking Loss function for Perceptual Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2105.02531v1
- Date: Thu, 6 May 2021 09:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 13:33:11.422970
- Title: (ASNA) An Attention-based Siamese-Difference Neural Network with
Surrogate Ranking Loss function for Perceptual Image Quality Assessment
- Title(参考訳): (ASNA) 視覚画像品質評価のためのサロゲートランクロス機能を有する注意に基づくシームズ差分ニューラルネットワーク
- Authors: Seyed Mehdi Ayyoubzadeh, Ali Royat
- Abstract要約: 画像復元と拡張のための逆訓練フレームワークを利用する深層畳み込みニューラルネットワーク(dcnn)は、処理された画像のシャープさを大幅に改善した。
イメージの知覚品質とよく一致したパフォーマンスを反映した定量的指標を開発する必要がある。
本稿では,従来のSiameseネットワークの拡張アーキテクチャを用いた畳み込みニューラルネットワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, deep convolutional neural networks (DCNN) that leverage the
adversarial training framework for image restoration and enhancement have
significantly improved the processed images' sharpness. Surprisingly, although
these DCNNs produced crispier images than other methods visually, they may get
a lower quality score when popular measures are employed for evaluating them.
Therefore it is necessary to develop a quantitative metric to reflect their
performances, which is well-aligned with the perceived quality of an image.
Famous quantitative metrics such as Peak signal-to-noise ratio (PSNR), The
structural similarity index measure (SSIM), and Perceptual Index (PI) are not
well-correlated with the mean opinion score (MOS) for an image, especially for
the neural networks trained with adversarial loss functions.
This paper has proposed a convolutional neural network using an extension
architecture of the traditional Siamese network so-called Siamese-Difference
neural network. We have equipped this architecture with the spatial and
channel-wise attention mechanism to increase our method's performance.
Finally, we employed an auxiliary loss function to train our model. The
suggested additional cost function surrogates ranking loss to increase
Spearman's rank correlation coefficient while it is differentiable concerning
the neural network parameters. Our method achieved superior performance in
\textbf{\textit{NTIRE 2021 Perceptual Image Quality Assessment}} Challenge. The
implementations of our proposed method are publicly available.
- Abstract(参考訳): 近年,画像復元・強調のための逆訓練フレームワークを活用した深層畳み込みニューラルネットワーク(dcnn)が,処理画像のシャープさを大幅に改善している。
意外なことに、これらのDCNNは視覚的に他の方法よりも鮮明な画像を生成するが、それらの評価に一般的な指標が用いられると、品質スコアが低下する可能性がある。
したがって、画像の知覚品質によく適合した、その性能を反映する定量的なメトリクスを開発する必要がある。
ピーク信号対雑音比(psnr)、構造類似度指標(ssim)、知覚指数(pi)などの有名な定量的指標は、画像の平均評価スコア(mos)、特に逆損失関数で訓練されたニューラルネットワークとよく相関しない。
本稿では,従来のシャムネットワークであるシャム・ディファレンスニューラルネットワークの拡張アーキテクチャを用いた畳み込みニューラルネットワークを提案する。
提案手法の性能向上のために,このアーキテクチャに空間的およびチャネル的注意機構を組み込んだ。
最後に,モデルの学習に補助的損失関数を用いた。
提案する追加コスト関数は、ニューラルネットワークパラメータに関して微分可能でありながら、スピアマンのランク相関係数を高めるためにランキング損失を推定する。
提案手法は, 知覚画像品質評価の課題である「textbf{\textit{NTIRE 2021 Perceptual Image Quality Assessment}} Challenge」において, 優れた性能を示した。
提案手法の実装は一般に公開されている。
関連論文リスト
- Defending Spiking Neural Networks against Adversarial Attacks through Image Purification [20.492531851480784]
Spiking Neural Networks(SNN)は、神経科学と機械学習のギャップを埋めることを目的としている。
SNNは畳み込みニューラルネットワークのような敵の攻撃に弱い。
本稿では,SNNの堅牢性を高めるための生物学的にインスパイアされた手法を提案する。
論文 参考訳(メタデータ) (2024-04-26T00:57:06Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Spherical CNN for Medical Imaging Applications: Importance of
Equivariance in image reconstruction and denoising [0.0]
同変ネットワークは、トモグラフィー応用のための効率的かつ高性能なアプローチである。
2次元および3次元の医療画像問題に対する同変球状CNNの有効性を評価した。
本稿では,従来の画像再構成ツールの補完としてSCNNを用いた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-06T21:18:47Z) - Increasing the Accuracy of a Neural Network Using Frequency Selective
Mesh-to-Grid Resampling [4.211128681972148]
ニューラルネットワークの入力データの処理にFSMR(Keypoint frequency selective mesh-to-grid resampling)を提案する。
ネットワークアーキテクチャや分類タスクによって、トレーニング中のFSMRの適用は学習プロセスに役立ちます。
ResNet50とOxflower17データセットの分類精度は最大4.31ポイント向上できる。
論文 参考訳(メタデータ) (2022-09-28T21:34:47Z) - Image Superresolution using Scale-Recurrent Dense Network [30.75380029218373]
畳み込みニューラルネットワーク(CNN)の設計の最近の進歩は、画像超解像(SR)の性能を大幅に向上させた。
残差ブロック内の一連の密接な接続を含む単位上に構築されたスケールリカレントSRアーキテクチャを提案する(Residual Dense Blocks (RDBs))。
我々のスケールリカレント設計は、現在の最先端のアプローチに比べてパラメトリックに効率的でありながら、より高いスケール要因の競合性能を提供する。
論文 参考訳(メタデータ) (2022-01-28T09:18:43Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - NeighCNN: A CNN based SAR Speckle Reduction using Feature preserving
Loss Function [1.7188280334580193]
NeighCNNは、乗法ノイズを処理するディープラーニングベースのスペックル削減アルゴリズムである。
様々な合成、および実際のSAR画像は、NeighCNNアーキテクチャのテストに使用される。
論文 参考訳(メタデータ) (2021-08-26T04:20:07Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。