論文の概要: Towards Overcoming Data Scarcity in Nuclear Energy: A Study on Critical Heat Flux with Physics-consistent Conditional Diffusion Model
- arxiv url: http://arxiv.org/abs/2511.16207v1
- Date: Thu, 20 Nov 2025 10:19:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.569158
- Title: Towards Overcoming Data Scarcity in Nuclear Energy: A Study on Critical Heat Flux with Physics-consistent Conditional Diffusion Model
- Title(参考訳): 核エネルギーにおけるデータスカシティの克服に向けて:物理条件拡散モデルによる臨界熱流束の研究
- Authors: Farah Alsafadi, Alexandra Akins, Xu Wu,
- Abstract要約: 拡散モデル(DM)のような深層生成モデルは、統計的にトレーニングデータに類似した高忠実な合成サンプルを生成することができる。
本稿では,核エネルギー応用におけるデータ不足を克服するためのDMの有効性について検討する。
- 参考スコア(独自算出の注目度): 44.6164235303852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative modeling provides a powerful pathway to overcome data scarcity in energy-related applications where experimental data are often limited, costly, or difficult to obtain. By learning the underlying probability distribution of the training dataset, deep generative models, such as the diffusion model (DM), can generate high-fidelity synthetic samples that statistically resemble the training data. Such synthetic data generation can significantly enrich the size and diversity of the available training data, and more importantly, improve the robustness of downstream machine learning models in predictive tasks. The objective of this paper is to investigate the effectiveness of DM for overcoming data scarcity in nuclear energy applications. By leveraging a public dataset on critical heat flux (CHF) that cover a wide range of commercial nuclear reactor operational conditions, we developed a DM that can generate an arbitrary amount of synthetic samples for augmenting of the CHF dataset. Since a vanilla DM can only generate samples randomly, we also developed a conditional DM capable of generating targeted CHF data under user-specified thermal-hydraulic conditions. The performance of the DM was evaluated based on their ability to capture empirical feature distributions and pair-wise correlations, as well as to maintain physical consistency. The results showed that both the DM and conditional DM can successfully generate realistic and physics-consistent CHF data. Furthermore, uncertainty quantification was performed to establish confidence in the generated data. The results demonstrated that the conditional DM is highly effective in augmenting CHF data while maintaining acceptable levels of uncertainty.
- Abstract(参考訳): 深層生成モデリングは、実験データがしばしば制限され、コストがかかり、取得が困難であるエネルギー関連のアプリケーションにおいて、データの不足を克服するための強力な経路を提供する。
トレーニングデータセットの基礎となる確率分布を学習することにより、拡散モデル(DM)のような深層生成モデルは、トレーニングデータに統計的に類似した高忠実な合成サンプルを生成することができる。
このような合成データ生成は、利用可能なトレーニングデータのサイズと多様性を大幅に向上させ、さらに重要なのは、予測タスクにおける下流機械学習モデルの堅牢性を改善することだ。
本研究の目的は,核エネルギー利用におけるデータ不足を克服するためのDMの有効性を検討することである。
商用原子炉の運転条件を幅広くカバーする臨界熱流束(CHF)に関する公開データセットを活用することで,CHFデータセットを増大させるための任意の量の合成サンプルを生成することができるDMを開発した。
また,バニラDMはサンプルをランダムに生成できるため,ユーザが特定した熱水和条件下でターゲットCHFデータを生成する条件DMも開発した。
DMの性能は,経験的特徴分布とペアワイド相関を捕捉し,物理的整合性を維持する能力に基づいて評価した。
その結果, DMと条件DMの両方が, 現実的かつ物理的に一貫性のあるCHFデータを生成することができた。
さらに、生成したデータの信頼性を確立するために不確実性定量化を行った。
その結果, 条件DMは, 不確実性の許容レベルを維持しつつ, CHFデータの増大に極めて有効であることがわかった。
関連論文リスト
- SIDE: Surrogate Conditional Data Extraction from Diffusion Models [32.18993348942877]
textbfSurrogate condItional Data extract (SIDE) は、データ駆動型サロゲート条件を構築し、任意のDPMからターゲット抽出を可能にするフレームワークである。
SIDEは、いわゆる安全無条件モデルからトレーニングデータを抽出し、条件付きモデルであってもベースラインアタックより優れていることを示す。
我々の研究は、DPMの脅威状況を再定義し、厳密な条件付けを基本的な脆弱性として確立し、モデルプライバシ評価のための新しいより強力なベンチマークを設定します。
論文 参考訳(メタデータ) (2024-10-03T13:17:06Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Deep Generative Modeling-based Data Augmentation with Demonstration
using the BFBT Benchmark Void Fraction Datasets [3.341975883864341]
本稿では、画像データ生成に広く用いられている深部生成モデル(DGM)の科学的データ拡張への応用について検討する。
トレーニングが完了すると、DGMはトレーニングデータに類似した合成データを生成し、データセットのサイズを大幅に拡大するために使用することができる。
論文 参考訳(メタデータ) (2023-08-19T22:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。