論文の概要: An adaptive sampling algorithm for data-generation to build a data-manifold for physical problem surrogate modeling
- arxiv url: http://arxiv.org/abs/2505.08487v1
- Date: Tue, 13 May 2025 12:17:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.548191
- Title: An adaptive sampling algorithm for data-generation to build a data-manifold for physical problem surrogate modeling
- Title(参考訳): 物理問題代理モデリングのためのデータマニフォールド構築のためのデータ生成のための適応サンプリングアルゴリズム
- Authors: Chetra Mang, Axel TahmasebiMoradi, David Danan, Mouadh Yagoubi,
- Abstract要約: 物理モデルを含むデータ生成のための適応サンプリングアルゴリズム(ASADG)を提案する。
より代表的な入力データを生成するLHS法と比較して,データサンプリングアルゴリズムの有効性を実証する。
- 参考スコア(独自算出の注目度): 0.7499722271664147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physical models classically involved Partial Differential equations (PDE) and depending of their underlying complexity and the level of accuracy required, and known to be computationally expensive to numerically solve them. Thus, an idea would be to create a surrogate model relying on data generated by such solver. However, training such a model on an imbalanced data have been shown to be a very difficult task. Indeed, if the distribution of input leads to a poor response manifold representation, the model may not learn well and consequently, it may not predict the outcome with acceptable accuracy. In this work, we present an Adaptive Sampling Algorithm for Data Generation (ASADG) involving a physical model. As the initial input data may not accurately represent the response manifold in higher dimension, this algorithm iteratively adds input data into it. At each step the barycenter of each simplicial complex, that the manifold is discretized into, is added as new input data, if a certain threshold is satisfied. We demonstrate the efficiency of the data sampling algorithm in comparison with LHS method for generating more representative input data. To do so, we focus on the construction of a harmonic transport problem metamodel by generating data through a classical solver. By using such algorithm, it is possible to generate the same number of input data as LHS while providing a better representation of the response manifold.
- Abstract(参考訳): 物理モデルは古典的には部分微分方程式 (Partial Differential equation, PDE) であり、その基礎となる複雑さと精度のレベルに依存しており、それらを数値的に解くのに計算コストがかかることが知られている。
したがって、そのような解法によって生成されるデータに依存する代理モデルを作ることが考えられている。
しかし、不均衡なデータに対するそのようなモデルのトレーニングは非常に難しいことが示されている。
実際、入力の分布が不十分な応答多様体表現に繋がる場合、モデルはうまく学習できず、その結果、許容できる精度で結果を予測することができない。
本研究では,物理モデルを含むデータ生成のための適応サンプリングアルゴリズム(ASADG)を提案する。
初期入力データは、高次元の応答多様体を正確に表現できないため、このアルゴリズムは入力データを反復的に追加する。
各ステップにおいて、あるしきい値が満たされれば、多様体を離散化して新しい入力データとして加算する。
より代表的な入力データを生成するLHS法と比較して,データサンプリングアルゴリズムの有効性を実証する。
そこで本研究では,古典的解法を用いてデータを生成することで,調和輸送問題メタモデルの構築に焦点をあてる。
このようなアルゴリズムを用いることで、応答多様体のより良い表現を提供しながら、LHSと同じ数の入力データを生成することができる。
関連論文リスト
- Method of data forward generation with partial differential equations for machine learning modeling in fluid mechanics [1.9688252014450927]
本研究では偏微分方程式(PDE)を用いた高効率データフォワード生成法を提案する。
射影法に埋め込まれたPoisson Neural Network (Poisson-NN) と、圧縮不能なNavier-Stokes方程式を解くためのマルチグリッド数値シミュレーションに埋め込まれたウェーブレット変換畳み込みニューラルネットワーク (WTCNN) をそれぞれ提案する。
論文 参考訳(メタデータ) (2025-01-06T15:17:13Z) - Modular Learning of Deep Causal Generative Models for High-dimensional Causal Inference [5.522612010562183]
Modular-DCMは、因果構造を考えると、敵のトレーニングを用いてネットワーク重みを学習する最初のアルゴリズムである。
本稿では,CelebA-HQ における因果不変予測問題を用いて,このアルゴリズムの COVIDx データセットとそのユーティリティへの収束性を示す。
論文 参考訳(メタデータ) (2024-01-02T20:31:15Z) - Score-based Diffusion Models in Function Space [137.70916238028306]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
この研究は、関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)と呼ばれる数学的に厳密なフレームワークを導入する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - The data-driven physical-based equations discovery using evolutionary
approach [77.34726150561087]
与えられた観測データから数学的方程式を発見するアルゴリズムについて述べる。
このアルゴリズムは遺伝的プログラミングとスパース回帰を組み合わせたものである。
解析方程式の発見や偏微分方程式(PDE)の発見にも用いられる。
論文 参考訳(メタデータ) (2020-04-03T17:21:57Z) - Semi-analytic approximate stability selection for correlated data in
generalized linear models [3.42658286826597]
そこで本研究では,繰り返しのフィッティングを行なわずに安定選択を行うことのできる,新しい近似推論アルゴリズムを提案する。
このアルゴリズムは,情報理論の統計力学とベクトル近似メッセージパッシングの複製法に基づく。
数値実験により, このアルゴリズムは, 合成データと実世界のデータの両方に対して, 高速収束と高い近似精度を示すことを示した。
論文 参考訳(メタデータ) (2020-03-19T10:43:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。