論文の概要: Image Super-Resolution using Explicit Perceptual Loss
- arxiv url: http://arxiv.org/abs/2009.00382v1
- Date: Tue, 1 Sep 2020 12:22:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 01:55:59.525407
- Title: Image Super-Resolution using Explicit Perceptual Loss
- Title(参考訳): 明示的知覚損失を用いた画像超解像
- Authors: Tomoki Yoshida and Kazutoshi Akita and Muhammad Haris and Norimichi
Ukita
- Abstract要約: 生成した画像の知覚スコアを提供するために直接訓練された機械学習モデルを利用する方法を示す。
実験の結果、明示的なアプローチは他のアプローチよりも知覚スコアが高いことが示された。
- 参考スコア(独自算出の注目度): 17.2448277365841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes an explicit way to optimize the super-resolution network
for generating visually pleasing images. The previous approaches use several
loss functions which is hard to interpret and has the implicit relationships to
improve the perceptual score. We show how to exploit the machine learning based
model which is directly trained to provide the perceptual score on generated
images. It is believed that these models can be used to optimizes the
super-resolution network which is easier to interpret. We further analyze the
characteristic of the existing loss and our proposed explicit perceptual loss
for better interpretation. The experimental results show the explicit approach
has a higher perceptual score than other approaches. Finally, we demonstrate
the relation of explicit perceptual loss and visually pleasing images using
subjective evaluation.
- Abstract(参考訳): 本稿では,画像生成のための高解像度ネットワークの最適化手法を提案する。
前者のアプローチでは、知覚スコアを改善するために、解釈が困難で暗黙的な関係を持ついくつかの損失関数を使用する。
生成した画像の知覚スコアを提供するために直接訓練された機械学習モデルを利用する方法を示す。
これらのモデルは,解釈が容易な超解像ネットワークの最適化に利用できると考えられる。
さらに,既存の損失の特徴と明確な知覚喪失を解析し,より良い解釈を行う。
実験の結果, 明示的アプローチは他のアプローチよりも高い知覚スコアを示した。
最後に、主観的評価を用いて、視知覚喪失と視覚満足画像の関係を示す。
関連論文リスト
- Confidence-aware Reward Optimization for Fine-tuning Text-to-Image Models [85.96013373385057]
人間のフィードバックデータに基づいて訓練された報酬関数を持つ微調整テキスト・ツー・イメージモデルは、モデル行動と人間の意図との整合性を実証した。
しかし、そのような報酬モデルによる過度な最適化は、単にプロキシの目的として機能し、微調整されたモデルの性能を損なう可能性がある。
本研究では,テキストプロンプトの集合に対して推定された報酬モデル信頼度に基づいてアライメントを強化する手法であるTextNormを提案する。
論文 参考訳(メタデータ) (2024-04-02T11:40:38Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Two-stage Visual Cues Enhancement Network for Referring Image
Segmentation [89.49412325699537]
Referring Image (RIS)は、ある自然言語表現によって参照される画像から対象のオブジェクトをセグメント化することを目的としている。
本稿では,2段階のビジュアルキュー拡張ネットワーク(TV-Net)を考案し,この問題に対処する。
この2段階の強化により,提案するTV-Netは,自然言語表現と画像間のきめ細かいマッチング動作の学習において,より優れた性能を享受できる。
論文 参考訳(メタデータ) (2021-10-09T02:53:39Z) - Inverting Adversarially Robust Networks for Image Synthesis [37.927552662984034]
本稿では,特徴反転モデルの知覚的プリミティブとしてロバスト表現を用いることを提案する。
画像として頑健な表現を採用することにより,CNNに基づく特徴反転モデルの再構成精度が大幅に向上することを示す。
そこで本研究では,ロバストな表現に基づく符号化復号ネットワークを提案し,異常検出,スタイル転送,画像復号化などの応用にその利点を示す。
論文 参考訳(メタデータ) (2021-06-13T05:51:00Z) - Regularization via deep generative models: an analysis point of view [8.818465117061205]
本稿では, イメージングにおける逆問題(例えば, デブロアリングやインペインティング)を, 深部生成ニューラルネットワークを用いて正則化する新しい手法を提案する。
多くの場合、我々の技術はパフォーマンスの明確な改善を実現し、より堅牢であるように思える。
論文 参考訳(メタデータ) (2021-01-21T15:04:57Z) - Projected Distribution Loss for Image Enhancement [15.297569497776374]
CNNアクティベーション間の1D-ワッサースタイン距離の集約は,既存の手法よりも信頼性が高いことを示す。
デノイジング、スーパーレゾリューション、復号化、デブレーション、JPEGアーティファクト除去などのイメージングアプリケーションでは、提案された学習損失は、参照ベースの知覚的損失に関する現在の最先端のものを上回る。
論文 参考訳(メタデータ) (2020-12-16T22:13:03Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Perceptually Optimizing Deep Image Compression [53.705543593594285]
平均二乗誤差(MSE)と$ell_p$ノルムは、ニューラルネットワークの損失の測定で大きく支配されている。
本稿では,定量的知覚モデルに対して,画像解析ネットワークを最適化するための異なるプロキシ手法を提案する。
論文 参考訳(メタデータ) (2020-07-03T14:33:28Z) - Assessing the Reliability of Visual Explanations of Deep Models with
Adversarial Perturbations [15.067369314723958]
本稿では,深層モデルの説明の信頼性を評価するための客観的尺度を提案する。
提案手法は,入力画像の逆方向の摂動によるネットワーク結果の変化に基づく。
我々はまた,本質的な説明を損なうことなく,より解釈可能な地図を創出し,関連性マップのクリーン化へのアプローチの直接的な適用を提案する。
論文 参考訳(メタデータ) (2020-04-22T19:57:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。