Fugu-MT 論文翻訳(概要): PatchScaler: An Efficient Patch-independent Diffusion Model for Super-Resolution

論文の概要: PatchScaler: An Efficient Patch-independent Diffusion Model for Super-Resolution

arxiv url: http://arxiv.org/abs/2405.17158v1
Date: Mon, 27 May 2024 13:31:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-28 15:13:09.298471
Title: PatchScaler: An Efficient Patch-independent Diffusion Model for Super-Resolution
Title（参考訳）: PatchScaler:超解法のための効率的パッチ非依存拡散モデル
Authors: Yong Liu, Hang Dong, Jinshan Pan, Qingji Dong, Kai Chen, Rongxiang Zhang, Xing Mei, Lean Fu, Fei Wang,
Abstract要約: 拡散モデルは、その印象的なコンテンツ生成機能により、超解像の品質を著しく向上させる。近年、サンプリングステップの数を削減すべく、合理的な推論アクセラレーションについて検討されているが、各ステップが全画像上で実行されるため、計算コストは高いままである。本稿では,パッチ非依存拡散に基づく単一画像超解像法であるPatchScalerを提案する。
参考スコア（独自算出の注目度）: 43.030127173648005
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Diffusion models significantly improve the quality of super-resolved images with their impressive content generation capabilities. However, the huge computational costs limit the applications of these methods.Recent efforts have explored reasonable inference acceleration to reduce the number of sampling steps, but the computational cost remains high as each step is performed on the entire image.This paper introduces PatchScaler, a patch-independent diffusion-based single image super-resolution (SR) method, designed to enhance the efficiency of the inference process.The proposed method is motivated by the observation that not all the image patches within an image need the same sampling steps for reconstructing high-resolution images.Based on this observation, we thus develop a Patch-adaptive Group Sampling (PGS) to divide feature patches into different groups according to the patch-level reconstruction difficulty and dynamically assign an appropriate sampling configuration for each group so that the inference speed can be better accelerated.In addition, to improve the denoising ability at each step of the sampling, we develop a texture prompt to guide the estimations of the diffusion model by retrieving high-quality texture priors from a patch-independent reference texture memory.Experiments show that our PatchScaler achieves favorable performance in both quantitative and qualitative evaluations with fast inference speed.Our code and model are available at \url{https://github.com/yongliuy/PatchScaler}.
Abstract（参考訳）: 拡散モデルは、その印象的なコンテンツ生成機能により、超解像の品質を著しく向上させる。提案手法は,画像中のすべての画像パッチが,高解像度画像の再構成に同じサンプリングステップを必要とするという観測結果から,パッチレベルの再構成の困難さに応じて,特徴パッチを異なるグループに分割するパッチ適応型グループサンプリング (PGS) を開発し,各グループに最適な設定を割り当てることにより,より高速に高速化し,より高速なテクスチャ・テクスチャ・テクスチャ・テクスチャ・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション・インジェクション(SR)法を提案する。

関連論文リスト

PFF-Net: Patch Feature Fitting for Point Cloud Normal Estimation [81.94096000733127]
点雲の頑健な正規推定のための特徴抽出の新しいアイデアを提案する。我々は、様々なデータやジオメトリに対して適切なパッチサイズを選択する問題に対処するために、異なる近傍サイズのマルチスケール特徴の融合を利用する。マルチスケールの特徴を集約した近似戦略により,各局所パッチのスケール適応を実現することができる。
論文参考訳（メタデータ） (2025-11-26T13:12:14Z)
PatchVSR: Breaking Video Diffusion Resolution Limits with Patch-wise Video Super-Resolution [65.09345929328586]
条件付き誘導のためのデュアルストリームアダプタを統合したPatchVSRという革新的な手法を提案する。提案手法はパッチレベルで高忠実で高解像度の細部を合成できることを示す。 512x512の解像度ベースモデルに基づいて、非常に高い効率で高い競争力を持つ4K VSRを実現することができる。
論文参考訳（メタデータ） (2025-09-30T09:55:14Z)
Minimal High-Resolution Patches Are Sufficient for Whole Slide Image Representation via Cascaded Dual-Scale Reconstruction [13.897013242536849]
全スライディング画像(WSI)解析は、ギガピクセルスケールとわずかに分散した診断領域のため、依然として困難である。本稿では,WSIあたりの平均9つの高解像度パッチだけが,スライドレベルの堅牢な表現に十分であることを示すカスケードデュアルスケール再構築フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-03T08:01:30Z)
APT: Improving Diffusion Models for High Resolution Image Generation with Adaptive Path Tracing [24.33819371470651]
遅延拡散モデル(LDM)は一般的に固定解像度で訓練され、高解像度画像へのスケーリングの能力を制限する。本稿では,アダプティブパストレース(APT)を提案する。これは,パッチ分布の一貫性を維持するために,統計的マッチングを組み合わせたフレームワークである。その結果、APTは高解像度画像においてより鮮明で洗練された細部を生成する。
論文参考訳（メタデータ） (2025-07-29T11:13:03Z)
PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [87.89013794655207]
拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文参考訳（メタデータ） (2024-11-26T04:49:42Z)
EPS: Efficient Patch Sampling for Video Overfitting in Deep Super-Resolution Model Training [15.684865589513597]
ビデオSRネットワークオーバーフィッティングのための効率的なパッチサンプリング手法であるEPSを提案する。本手法は,クラスタの解像度や数に応じて,トレーニング用パッチの数を4%から25%に削減する。最新のパッチサンプリング手法であるEMTと比較して,本手法は全体の実行時間を83%削減する。
論文参考訳（メタデータ） (2024-11-25T12:01:57Z)
Adaptive Patching for High-resolution Image Segmentation with Transformers [9.525013089622183]
注意に基づくモデルは、セグメンテーションを含む画像分析の領域で増加している。トランスフォーマーエンコーダにイメージを供給する標準的な方法は、イメージをパッチに分割し、トークンの線形シーケンスとしてモデルにパッチを供給することである。顕微鏡病理画像などの高解像度画像では、セグメンテーションで好まれる小さなパッチサイズを使用する場合、二次計算とメモリコストは注意に基づくモデルの使用を禁止している。我々はHPCのAdapative Mesh Refinement(AMR)法から着想を得た。
論文参考訳（メタデータ） (2024-04-15T12:06:00Z)
EXTRACTER: Efficient Texture Matching with Attention and Gradient Enhancing for Large Scale Image Super Resolution [0.0]
近年のレファレンスベース画像超解像(RefSR)は、低解像度画像の高精細化を目的とした注意機構を導入したSOTAディープ手法を改善している。より効率的なメモリ使用率を持つディープ検索を提案し,画像パッチ数を大幅に削減する。
論文参考訳（メタデータ） (2023-10-02T17:41:56Z)
DBAT: Dynamic Backward Attention Transformer for Material Segmentation with Cross-Resolution Patches [8.812837829361923]
クロスレゾリューション特徴を集約する動的後方アテンション変換器(DBAT)を提案する。実験の結果,DBATの精度は86.85%であり,最先端のリアルタイムモデルの中では最高の性能であることがわかった。さらに,提案モデルが他の手法よりも優れた材料関連特徴を抽出できることを示すため,セマンティックなラベルにアライメントし,ネットワーク分割を行う。
論文参考訳（メタデータ） (2023-05-06T03:47:20Z)
FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。 FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文参考訳（メタデータ） (2022-07-18T07:11:28Z)
HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文参考訳（メタデータ） (2022-03-19T05:09:34Z)
SDWNet: A Straight Dilated Network with Wavelet Transformation for Image Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文参考訳（メタデータ） (2021-10-12T07:58:10Z)
Variable-Rate Deep Image Compression through Spatially-Adaptive Feature Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文参考訳（メタデータ） (2021-08-21T17:30:06Z)
A Hierarchical Transformation-Discriminating Generative Model for Few Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文参考訳（メタデータ） (2021-04-29T17:49:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。