Fugu-MT 論文翻訳(概要): A General Method to Incorporate Spatial Information into Loss Functions for GAN-based Super-resolution Models

論文の概要: A General Method to Incorporate Spatial Information into Loss Functions for GAN-based Super-resolution Models

arxiv url: http://arxiv.org/abs/2403.10589v1
Date: Fri, 15 Mar 2024 17:29:16 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-19 22:44:00.373638
Title: A General Method to Incorporate Spatial Information into Loss Functions for GAN-based Super-resolution Models
Title（参考訳）: GANに基づく超解像モデルにおける空間情報を損失関数に組み込む一般手法
Authors: Xijun Wang, Santiago López-Tapia, Alice Lucas, Xinyi Wu, Rafael Molina, Aggelos K. Katsaggelos,
Abstract要約: GAN(Generative Adversarial Networks)は超解像問題において優れた性能を示した。 GANは、予期せぬアーチファクトやノイズなど、出力に副作用をもたらすことが多い。本稿では,多くのGANベース超解像(SR)モデルにおいて,トレーニングプロセスに必須空間情報を導入することで,効果的に活用できる汎用手法を提案する。
参考スコア（独自算出の注目度）: 25.69505971220203
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative Adversarial Networks (GANs) have shown great performance on super-resolution problems since they can generate more visually realistic images and video frames. However, these models often introduce side effects into the outputs, such as unexpected artifacts and noises. To reduce these artifacts and enhance the perceptual quality of the results, in this paper, we propose a general method that can be effectively used in most GAN-based super-resolution (SR) models by introducing essential spatial information into the training process. We extract spatial information from the input data and incorporate it into the training loss, making the corresponding loss a spatially adaptive (SA) one. After that, we utilize it to guide the training process. We will show that the proposed approach is independent of the methods used to extract the spatial information and independent of the SR tasks and models. This method consistently guides the training process towards generating visually pleasing SR images and video frames, substantially mitigating artifacts and noise, ultimately leading to enhanced perceptual quality.
Abstract（参考訳）: GAN(Generative Adversarial Networks)は、より視覚的にリアルな画像やビデオフレームを生成することができるため、超高解像度な問題に対して優れた性能を示している。しかしながら、これらのモデルは、予期せぬアーチファクトやノイズなどの出力に副作用をもたらすことが多い。本稿では,これらのアーティファクトを低減し,その結果の知覚的品質を高めるために,トレーニングプロセスに不可欠な空間情報を導入することで,ほとんどのGANベース超解像(SR)モデルで効果的に使用できる一般手法を提案する。入力データから空間情報を抽出し、トレーニング損失に組み込むことにより、対応する損失を空間適応(SA)する。その後、トレーニングプロセスのガイドに利用します。提案手法は空間情報を抽出する手法とは独立であり,SRタスクやモデルとは独立であることを示す。この方法では、視覚的に満足なSR画像やビデオフレームを生成するためのトレーニングプロセスが一貫してガイドされ、アーティファクトやノイズが大幅に軽減され、最終的には知覚品質が向上する。

関連論文リスト

Adversarial Semantic Augmentation for Training Generative Adversarial Networks under Limited Data [27.27230943686822]
本稿では,画像レベルではなくセマンティックレベルでトレーニングデータを拡大するために,敵対的セマンティック拡張(ASA)手法を提案する。本手法は, 各種データ構造下での合成品質を継続的に改善する。
論文参考訳（メタデータ） (2025-02-02T13:50:38Z)
Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文参考訳（メタデータ） (2024-09-25T16:15:21Z)
Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文参考訳（メタデータ） (2024-05-23T09:13:36Z)
Learning from Multi-Perception Features for Real-Word Image Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文参考訳（メタデータ） (2023-05-26T07:35:49Z)
Real-World Image Super-Resolution by Exclusionary Dual-Learning [98.36096041099906]
実世界の画像超解像は,高品質な画像を得るための実用的な画像復元問題である。深層学習に基づく手法は、現実世界の超解像データセットの復元に期待できる品質を実現している。本稿では,RWSR-EDL(Real-World Image Super-Resolution by Exclusionary Dual-Learning)を提案する。
論文参考訳（メタデータ） (2022-06-06T13:28:15Z)
Single Image Internal Distribution Measurement Using Non-Local Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。 textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。 7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文参考訳（メタデータ） (2022-04-02T18:43:55Z)
Details or Artifacts: A Locally Discriminative Learning Approach to Realistic Image Super-Resolution [28.00231586840797]
近年,GAN (Generative Adversarial Network) の単一画像超解像 (SISR) が注目されている。本稿では、視覚的アーチファクトを抑えつつ、知覚的にリアルなディテールを安定的に生成できるGANベースのSISRモデルを訓練できることを実証する。
論文参考訳（メタデータ） (2022-03-17T09:35:50Z)
A comparative study of various Deep Learning techniques for spatio-temporal Super-Resolution reconstruction of Forced Isotropic Turbulent flows [0.45935798913942893]
本研究では,様々な最先端機械学習技術を用いて,空間的・時間的に乱流場の超解像解析を行う。この研究で使用されるデータセットは、ジョンズ・ホプキンス乱流データベースの一部である「等方性1024粗い」データセットから抽出される。
論文参考訳（メタデータ） (2021-07-07T17:16:55Z)
Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文参考訳（メタデータ） (2021-03-29T02:58:27Z)
Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文参考訳（メタデータ） (2020-12-16T21:46:33Z)
Characteristic Regularisation for Super-Resolving Face Images [81.84939112201377]
既存の顔画像超解像法(SR)は、主に人工的にダウンサンプリングされた低解像度(LR)画像の改善に焦点を当てている。従来の非教師なしドメイン適応(UDA)手法は、未ペアの真のLRとHRデータを用いてモデルをトレーニングすることでこの問題に対処する。これにより、視覚的特徴を構成することと、画像の解像度を高めることの2つのタスクで、モデルをオーバーストレッチする。従来のSRモデルとUDAモデルの利点を結合する手法を定式化する。
論文参考訳（メタデータ） (2019-12-30T16:27:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。