論文の概要: A Novel Diffusion Model for Pairwise Geoscience Data Generation with Unbalanced Training Dataset
- arxiv url: http://arxiv.org/abs/2501.00941v1
- Date: Wed, 01 Jan 2025 19:49:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:15:14.331476
- Title: A Novel Diffusion Model for Pairwise Geoscience Data Generation with Unbalanced Training Dataset
- Title(参考訳): 不均衡トレーニングデータセットを用いたペアワイズ地球科学データ生成のための新しい拡散モデル
- Authors: Junhuan Yang, Yuzhou Zhang, Yi Sheng, Youzuo Lin, Lei Yang,
- Abstract要約: UB-Diff'はマルチモーダルなペア型科学データ生成のための新しい拡散モデルである。
1つの大きな革新は、1対2のエンコーダ・デコーダネットワーク構造であり、コラテント表現からペアのデータを確実に得ることができる。
OpenFWIデータセットの実験結果から,UB-DiffはFr'echet Inception Distance(FID)スコアとペア評価において,既存の技術よりも優れていた。
- 参考スコア(独自算出の注目度): 8.453075713579631
- License:
- Abstract: Recently, the advent of generative AI technologies has made transformational impacts on our daily lives, yet its application in scientific applications remains in its early stages. Data scarcity is a major, well-known barrier in data-driven scientific computing, so physics-guided generative AI holds significant promise. In scientific computing, most tasks study the conversion of multiple data modalities to describe physical phenomena, for example, spatial and waveform in seismic imaging, time and frequency in signal processing, and temporal and spectral in climate modeling; as such, multi-modal pairwise data generation is highly required instead of single-modal data generation, which is usually used in natural images (e.g., faces, scenery). Moreover, in real-world applications, the unbalance of available data in terms of modalities commonly exists; for example, the spatial data (i.e., velocity maps) in seismic imaging can be easily simulated, but real-world seismic waveform is largely lacking. While the most recent efforts enable the powerful diffusion model to generate multi-modal data, how to leverage the unbalanced available data is still unclear. In this work, we use seismic imaging in subsurface geophysics as a vehicle to present ``UB-Diff'', a novel diffusion model for multi-modal paired scientific data generation. One major innovation is a one-in-two-out encoder-decoder network structure, which can ensure pairwise data is obtained from a co-latent representation. Then, the co-latent representation will be used by the diffusion process for pairwise data generation. Experimental results on the OpenFWI dataset show that UB-Diff significantly outperforms existing techniques in terms of Fr\'{e}chet Inception Distance (FID) score and pairwise evaluation, indicating the generation of reliable and useful multi-modal pairwise data.
- Abstract(参考訳): 近年、生成型AI技術の出現は、私たちの日常生活に変革をもたらしたが、その科学的応用は、まだ初期段階にある。
データ不足はデータ駆動型科学計算における主要な障壁であり、物理誘導型生成AIは大きな可能性を秘めている。
科学計算において、ほとんどのタスクは、地震画像における空間と波形、信号処理における時間と周波数、気候モデリングにおける時間とスペクトルなどの物理現象を記述するために複数のデータモダリティの変換を研究する。
さらに、現実の応用においては、例えば、地震画像における空間データ(すなわち速度マップ)は容易にシミュレートできるが、現実の地震波形はほとんど欠落している。
最近の取り組みでは、強力な拡散モデルによってマルチモーダルデータを生成することができるが、不均衡なデータを利用する方法はまだ不明である。
本研究では,マルチモーダルなペア型科学データ生成のための新しい拡散モデルである ‘UB-Diff' を車両として,地下物理における地震波画像を用いて提示する。
1つの大きな革新は、1対2のエンコーダ・デコーダネットワーク構造であり、コラテント表現からペアのデータを確実に得ることができる。
次に、ペアワイズデータ生成のための拡散プロセスでコラテント表現を使用する。
OpenFWIデータセットの実験結果によると、UB-DiffはFr\'{e}chet Inception Distance(FID)スコアとペア評価で既存の技術よりも優れており、信頼性が高く有用なマルチモーダルペアワイズデータの生成を示している。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Discovering Latent Structural Causal Models from Spatio-Temporal Data [23.400027588427964]
SPACY(SPAtiotemporal Causal discoverY)は変分推論に基づく新しいフレームワークである。
SPACYは、合成データに対する最先端のベースラインよりも優れ、大きなグリッドに対してスケーラブルであり、現実世界の気候データから既知の重要な現象を識別する。
論文 参考訳(メタデータ) (2024-11-08T05:12:16Z) - MDM: Advancing Multi-Domain Distribution Matching for Automatic Modulation Recognition Dataset Synthesis [35.07663680944459]
ディープラーニング技術は、AMR(Automatic Modulation Recognition)タスクにうまく導入されている。
ディープラーニングの成功はすべて、大規模なデータセットのトレーニングによるものだ。
大量のデータの問題を解決するため、一部の研究者はデータ蒸留法を提唱した。
論文 参考訳(メタデータ) (2024-08-05T14:16:54Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Deep Generative Data Assimilation in Multimodal Setting [0.1052166918701117]
本研究では,マルチモーダル・セッティングにおけるスコアベースラテント・アシミレーション(SLAMS)を提案する。
気象観測所のデータと衛星画像とを同化して、垂直温度分布を世界規模で校正する。
私たちの研究は、実世界のデータセットを用いたマルチモーダルデータ同化に、初めて深層生成フレームワークを適用しました。
論文 参考訳(メタデータ) (2024-04-10T00:25:09Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Deep Generative Modeling-based Data Augmentation with Demonstration
using the BFBT Benchmark Void Fraction Datasets [3.341975883864341]
本稿では、画像データ生成に広く用いられている深部生成モデル(DGM)の科学的データ拡張への応用について検討する。
トレーニングが完了すると、DGMはトレーニングデータに類似した合成データを生成し、データセットのサイズを大幅に拡大するために使用することができる。
論文 参考訳(メタデータ) (2023-08-19T22:19:41Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Generating artificial digital image correlation data using
physics-guided adversarial networks [2.07180164747172]
デジタル画像相関 (DIC) は, き裂標本の機械的実験を監視し評価するための貴重なツールとなっている。
実補間DIC変位に類似したクラック試験片の大量の人工変位データを直接生成する手法を提案する。
論文 参考訳(メタデータ) (2023-03-28T12:52:40Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。