論文の概要: Coupled Diffusion-Encoder Models for Reconstruction of Flow Fields
- arxiv url: http://arxiv.org/abs/2601.07946v1
- Date: Mon, 12 Jan 2026 19:24:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.915477
- Title: Coupled Diffusion-Encoder Models for Reconstruction of Flow Fields
- Title(参考訳): 連成拡散エンコーダモデルによる流れ場の再構成
- Authors: AmirPouya Hemmasian, Amir Barati Farimani,
- Abstract要約: 本稿では,従来の畳み込み型ResNetエンコーダと確率拡散モデルを統合する結合フレームワークであるDiffCoderを提案する。
積極的な圧縮の下では、DiffCoderはスペクトル精度を大幅に向上し、VAEは相当な劣化を示す。
DiffCoderはフローの分布構造をよりよく保存する。
- 参考スコア(独自算出の注目度): 11.478292682955669
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-driven flow-field reconstruction typically relies on autoencoder architectures that compress high-dimensional states into low-dimensional latent representations. However, classical approaches such as variational autoencoders (VAEs) often struggle to preserve the higher-order statistical structure of fluid flows when subjected to strong compression. We propose DiffCoder, a coupled framework that integrates a probabilistic diffusion model with a conventional convolutional ResNet encoder and trains both components end-to-end. The encoder compresses the flow field into a latent representation, while the diffusion model learns a generative prior over reconstructions conditioned on the compressed state. This design allows DiffCoder to recover distributional and spectral properties that are not strictly required for minimizing pointwise reconstruction loss but are critical for faithfully representing statistical properties of the flow field. We evaluate DiffCoder and VAE baselines across multiple model sizes and compression ratios on a challenging dataset of Kolmogorov flow fields. Under aggressive compression, DiffCoder significantly improves the spectral accuracy while VAEs exhibit substantial degradation. Although both methods show comparable relative L2 reconstruction error, DiffCoder better preserves the underlying distributional structure of the flow. At moderate compression levels, sufficiently large VAEs remain competitive, suggesting that diffusion-based priors provide the greatest benefit when information bottlenecks are severe. These results demonstrate that the generative decoding by diffusion offers a promising path toward compact, statistically consistent representations of complex flow fields.
- Abstract(参考訳): データ駆動フローフィールド再構成は通常、高次元状態を低次元の潜在表現に圧縮するオートエンコーダアーキテクチャに依存する。
しかし、変分オートエンコーダ(VAE)のような古典的な手法は、強い圧縮を受けると流体の流れの高次統計構造を維持するのにしばしば苦労する。
本稿では,従来の畳み込み型ResNetエンコーダと確率拡散モデルを統合したフレームワークであるDiffCoderを提案し,両コンポーネントをエンドツーエンドにトレーニングする。
エンコーダは、流れ場を遅延表現に圧縮し、拡散モデルは、圧縮状態に条件付けられた再構成よりも、生成前を学習する。
この設計により、DiffCoderは、点分割損失を最小限に抑えるために厳密には必要とされない分布特性とスペクトル特性を復元できるが、流れ場の統計特性を忠実に表現するためには重要である。
我々は,DiffCoder と VAE のベースラインを複数のモデルサイズで評価し,コンモゴロフ流れ場の挑戦的データセット上で圧縮比を評価する。
積極的な圧縮の下では、DiffCoderはスペクトル精度を大幅に向上し、VAEは相当な劣化を示す。
DiffCoderはフローの分布構造をよりよく保存する。
ある程度の圧縮レベルでは、十分に大きなVAEは競争力を維持しており、情報ボトルネックが深刻である場合に拡散ベースの先行が最大の利益をもたらすことを示唆している。
これらの結果は、拡散による生成的復号化は、複素流れ場のコンパクトで統計的に一貫した表現への有望な経路を提供することを示している。
関連論文リスト
- FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems [51.15230303652732]
FLEX (F Low Expert) は、時間物理系の生成モデリングのためのバックボーンアーキテクチャである。
拡散モデルにおける速度場の分散を低減し、トレーニングの安定化に役立つ。
少数の特徴を2つの逆拡散ステップとして用いて、超解像および予測タスクの正確な予測を行う。
論文 参考訳(メタデータ) (2025-05-23T00:07:59Z) - Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.164354605550194]
新しいトークン化ツールであるDiffusion Conditioned-based Gene Tokenizerは、GANベースのデコーダを条件付き拡散モデルで置き換える。
再建に基本的MSE拡散損失とKL項,LPIPSを併用した訓練を行った。
CDTのスケールダウン版(3$times inference speedup)でさえ、トップベースラインと互換性がある。
論文 参考訳(メタデータ) (2025-03-05T17:59:19Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Lossy Image Compression with Conditional Diffusion Models [25.158390422252097]
本稿では,拡散生成モデルを用いた画像圧縮のエンドツーエンド最適化について概説する。
VAEベースのニューラル圧縮とは対照的に、(平均)デコーダは決定論的ニューラルネットワークであり、私たちのデコーダは条件付き拡散モデルである。
提案手法では,GANモデルよりもFIDスコアが強く,VAEモデルとの競合性能も高い。
論文 参考訳(メタデータ) (2022-09-14T21:53:27Z) - Lossy Compression with Gaussian Diffusion [28.930398810600504]
非条件拡散生成モデルに基づく新しい損失圧縮手法DiffCについて述べる。
エンコーダ変換の欠如にもかかわらず、概念実証を実装し、驚くほどうまく機能することを発見した。
流れに基づく再構築は,祖先サンプリングよりも高頻度で3dBのゲインを達成できることを示す。
論文 参考訳(メタデータ) (2022-06-17T16:46:31Z) - The Deep Generative Decoder: MAP estimation of representations improves
modeling of single-cell RNA data [0.0]
モデルパラメータと表現を直接最大後部推定(MAP)により計算する単純な生成モデルを提案する。
このアプローチの利点は、その単純さと、同等のVAEよりもはるかに小さな次元の表現を提供する能力である。
論文 参考訳(メタデータ) (2021-10-13T12:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。