論文の概要: Composite Classifier-Free Guidance for Multi-Modal Conditioning in Wind Dynamics Super-Resolution
- arxiv url: http://arxiv.org/abs/2512.13729v1
- Date: Sat, 13 Dec 2025 22:44:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.403314
- Title: Composite Classifier-Free Guidance for Multi-Modal Conditioning in Wind Dynamics Super-Resolution
- Title(参考訳): 風力ダイナミクス超解法におけるマルチモード条件付複合分類器フリーガイダンス
- Authors: Jacob Schnell, Aditya Makkar, Gunadi Gani, Aniket Srinivasan Ashok, Darren Lo, Mike Optis, Alexander Wong, Yuhao Chen,
- Abstract要約: 風のデータは自然画像とは異なる。
ウィンドスーパーリゾルバは10以上の入力チャネルを使用することが多く、自然画像の通常の3チャンネルのRGB入力よりもはるかに多い。
本研究では,産業規模の風力力学再構築のための拡散モデルWindDMを提案する。
- 参考スコア(独自算出の注目度): 45.85259700126175
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Various weather modelling problems (e.g., weather forecasting, optimizing turbine placements, etc.) require ample access to high-resolution, highly accurate wind data. Acquiring such high-resolution wind data, however, remains a challenging and expensive endeavour. Traditional reconstruction approaches are typically either cost-effective or accurate, but not both. Deep learning methods, including diffusion models, have been proposed to resolve this trade-off by leveraging advances in natural image super-resolution. Wind data, however, is distinct from natural images, and wind super-resolvers often use upwards of 10 input channels, significantly more than the usual 3-channel RGB inputs in natural images. To better leverage a large number of conditioning variables in diffusion models, we present a generalization of classifier-free guidance (CFG) to multiple conditioning inputs. Our novel composite classifier-free guidance (CCFG) can be dropped into any pre-trained diffusion model trained with standard CFG dropout. We demonstrate that CCFG outputs are higher-fidelity than those from CFG on wind super-resolution tasks. We present WindDM, a diffusion model trained for industrial-scale wind dynamics reconstruction and leveraging CCFG. WindDM achieves state-of-the-art reconstruction quality among deep learning models and costs up to $1000\times$ less than classical methods.
- Abstract(参考訳): 様々な気象モデリング問題(例えば、天気予報、タービン配置の最適化など)は、高解像度で高精度な風データに十分なアクセスを必要とする。
しかし、このような高解像度の風データを取得することは、依然として困難で高価な努力である。
伝統的な再建アプローチは一般的に費用対効果か正確かのいずれかであるが、両方ではない。
拡散モデルを含む深層学習手法は、自然画像の超解像の進歩を活用して、このトレードオフを解決するために提案されている。
しかし、風のデータは自然画像と異なり、風の超解法は自然画像の通常の3チャンネルRGB入力よりもはるかに高い10以上の入力チャネルを使用することが多い。
拡散モデルにおける多数の条件変数をよりよく活用するために,複数条件入力に対する分類器フリーガイダンス(CFG)の一般化を提案する。
標準CFGドロップアウトでトレーニングした任意の事前学習拡散モデルに,新しい複合分類器フリーガイダンス(CCFG)を適用できる。
風力超解像におけるCFGの出力はCFGの出力よりも高忠実であることを示す。
我々は,産業規模の風力力学の再構築とCFGの活用のために訓練された拡散モデルWindDMを提案する。
WindDMは、ディープラーニングモデルの間で最先端の再構築品質を実現し、古典的手法よりも1000ドルも安い。
関連論文リスト
- Diversity Has Always Been There in Your Visual Autoregressive Models [78.27363151940996]
Visual Autoregressive (VAR)モデルは、最近、革新的な次世代の予測パラダイムに対して大きな注目を集めている。
それらの効率にもかかわらず、VARモデルは、数段階の蒸留拡散モデルで観察されたような多様性の崩壊に悩まされることが多い。
本稿では、VARモデルの生成多様性を、追加のトレーニングを必要とせずに復元する、シンプルで効果的なアプローチであるDiverse VARを紹介する。
論文 参考訳(メタデータ) (2025-11-21T09:24:09Z) - FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion [63.609399000712905]
スケールした解像度での推論は反復的なパターンと構造的歪みをもたらす。
これらの問題を解決するために組み合わせた2つの単純なモジュールを提案する。
我々の手法はファム拡散と呼ばれ、任意の潜在拡散モデルにシームレスに統合でき、追加の訓練を必要としない。
論文 参考訳(メタデータ) (2024-11-27T17:51:44Z) - Effective Diffusion Transformer Architecture for Image Super-Resolution [63.254644431016345]
画像超解像のための効果的な拡散変換器(DiT-SR)を設計する。
実際には、DiT-SRは全体のU字型アーキテクチャを活用し、すべての変圧器ブロックに対して均一な等方性設計を採用する。
我々は、広く使われているAdaLNの制限を分析し、周波数適応型時間-ステップ条件付けモジュールを提案する。
論文 参考訳(メタデータ) (2024-09-29T07:14:16Z) - CFG++: Manifold-constrained Classifier Free Guidance for Diffusion Models [52.29804282879437]
CFG++は、従来のCFG固有のオフマンドの課題に取り組む新しいアプローチである。
より優れたインバージョン・ツー・イメージ生成、可逆性、ガイダンススケールの縮小、モード崩壊の削減などを提供する。
高次拡散解法に容易に統合でき、自然に蒸留拡散モデルに拡張できる。
論文 参考訳(メタデータ) (2024-06-12T10:40:10Z) - CRS-Diff: Controllable Remote Sensing Image Generation with Diffusion Model [42.92146478120197]
CRS-Diffは、RS画像生成に特化した新しいRS生成フレームワークである。
我々の知る限り、CRS-Diffは、最初の多重条件制御可能なRS生成モデルである。
私たちのCRS-Diffは、下流タスクのための高品質なトレーニングデータを生成するデータエンジンとして機能します。
論文 参考訳(メタデータ) (2024-03-18T09:44:44Z) - Latent Diffusion Model for Conditional Reservoir Facies Generation [0.7916635054977068]
貯水池環境の条件付き生成に特化して設計された新しい潜水拡散モデルが提案されている。
提案モデルでは条件付きデータを厳格に保存する高忠実度ファシリゼーションを実現する。
論文 参考訳(メタデータ) (2023-11-03T15:10:05Z) - Breaking Through the Haze: An Advanced Non-Homogeneous Dehazing Method
based on Fast Fourier Convolution and ConvNeXt [14.917290578644424]
ヘイズは通常、低コントラスト、色の変化、構造歪みで劣化した画像につながる。
本稿では、2次元離散ウェーブレット変換(DWT)、高速フーリエ畳み込み(FFC)残差ブロック、事前訓練されたConvNeXtモデルを活用する2つの分岐ネットワークを提案する。
我々のモデルは、グローバルな文脈情報を効果的に探索し、知覚品質の高い画像を生成することができる。
論文 参考訳(メタデータ) (2023-05-08T02:59:02Z) - AT-DDPM: Restoring Faces degraded by Atmospheric Turbulence using
Denoising Diffusion Probabilistic Models [64.24948495708337]
大気の乱流は、ぼやけや幾何学的歪みを導入して画質を著しく劣化させる。
CNNベースやGANインバージョンベースなど,深層学習に基づく単一画像大気乱流低減手法が提案されている。
Denoising Diffusion Probabilistic Models (DDPMs) は、その安定したトレーニングプロセスと高品質な画像を生成する能力により、最近注目を集めている。
論文 参考訳(メタデータ) (2022-08-24T03:13:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。