論文の概要: Physical Simulators as Do-Operators: Causal Discovery under Latent Confounders for AI-for-Science
- arxiv url: http://arxiv.org/abs/2605.07467v1
- Date: Fri, 08 May 2026 09:14:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.942251
- Title: Physical Simulators as Do-Operators: Causal Discovery under Latent Confounders for AI-for-Science
- Title(参考訳): Do-Operatorsとしての物理シミュレータ - AI-for-Scienceの共同設立者による因果発見
- Authors: Tsuyoshi Okita,
- Abstract要約: AI-for-Science設定では、潜伏する共同ファウンダーはユビキタスであり、実際の介入にはデータポイントあたり数時間から数日を要する。
我々は,Pearlの介入計算において,第1原理の物理シミュレータをdo-opersとして使用して,潜伏した共同設立者と実データとを同時に処理するCFM-SDを提案する。
- 参考スコア(独自算出の注目度): 2.0013177824602444
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing interventional causal discovery methods -- IGSP, DCDI, ENCO -- assume causal sufficiency (no latent confounders) and rely on virtual interventions in synthetic simulators. In AI-for-Science settings such as molecular design and materials science, latent confounders are ubiquitous and real interventions (e.g., physics-based simulations) require hours to days per data point. We propose CFM-SD (Causal Flow Matching with Simulation Data), which uses first-principles physical simulators as do-operators in Pearl's interventional calculus to simultaneously handle latent confounders and real interventional data. Theoretically, $d$-variable causal structure is identifiable with $O(d)$ single-variable interventions -- the minimum under physical realizability constraints. In Intrinsic Evaluation on synthetic data ($γ=0.2$--$0.8$), CFM-SD achieves average F1$=0.800$ vs. F1$=0.127$--$0.562$ for all baselines. In Extrinsic Evaluation on real scientific data, CFM-SD achieves 57--58\% bias reduction in molecular toxicity prediction and battery electrolyte optimization, demonstrating practical value beyond synthetic benchmarks.
- Abstract(参考訳): 既存の介入因果発見手法(IGSP、DCDI、ENCO)は因果補充を前提としており、合成シミュレータの仮想介入に依存している。
分子設計や材料科学のようなAIのための設定では、潜伏した共同創設者はユビキタスであり、実際の介入(物理ベースのシミュレーションなど)はデータポイント当たりの数時間から数日を要する。
CFM-SD(Causal Flow Matching with Simulation Data)を提案する。これは、Pearlの介入計算において、第一原理の物理シミュレータを演算子として使用し、潜伏した共同設立者と実際の介入データとを同時に処理する。
理論的には、$d$-variable causal structure は$O(d)$ single-variable interventions -- 物理的実現可能性制約の下で最小限の$O(d)$で識別できる。合成データ(γ=0.2$--$0.8$)の本質的な評価において、CFM-SD は平均 F1$=0.800$ 対 F1$=0.127$--$0.562$ を達成する。
CFM-SDは、分子毒性予測と電池電解質の最適化において57~58%のバイアス低減を実現し、合成ベンチマークを超えて実用的価値を実証した。
関連論文リスト
- Mixture of Experts Framework in Machine Learning Interatomic Potentials for Atomistic Simulations [0.3024996106292169]
第一原理原子論シミュレーションは複雑な物質現象を理解するのに不可欠であるが、その計算コストによって根本的に制限される。
本稿では,E(3)-equivariant Allegroアーキテクチャに基づくマルチフィデリティな"Mixture-of-Experts"フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-28T22:04:05Z) - JetPrism: diagnosing convergence for generative simulation and inverse problems in nuclear physics [0.5823178881486669]
高忠実度モンテカルロシミュレーションと複素逆問題(英語版)は、頑健なデータ解析に必要不可欠である。
条件付きフローマッチング(CFM)は、これらのタスクを加速するための数学的に堅牢なアプローチを提供するが、その標準的なトレーニング損失が根本的に誤解を招くことを実証する。
厳密な物理学の応用において、CFM損失プラトーは、真の収束と物理的忠実性の信頼性の低い指標として機能する。
論文 参考訳(メタデータ) (2026-04-01T18:36:47Z) - SimulCost: A Cost-Aware Benchmark and Toolkit for Automating Physics Simulations with LLMs [56.07550353240028]
物理シミュレーションにおけるコスト依存パラメータチューニングをターゲットとした最初のベンチマークであるSimulCostを紹介する。
SimulCostは、LCMチューニングのコスト感受性パラメータと従来のスキャン手法の精度と計算コストを比較した。
各シミュレータのコストは解析的に定義され、プラットフォームに依存しない。
論文 参考訳(メタデータ) (2026-03-11T05:00:48Z) - Sim-and-Human Co-training for Data-Efficient and Generalizable Robotic Manipulation [113.13282853889818]
SimHumは、シミュレーションされたロボット行動と実世界の人間の観察から視覚的事前を同時に抽出するフレームワークである。
2つの相補的前提に基づき、実世界のタスクにおいて、データ効率と一般化可能なロボット操作を実現する。
論文 参考訳(メタデータ) (2026-01-27T09:41:28Z) - PHASE: Physics-Integrated, Heterogeneity-Aware Surrogates for Scientific Simulations [14.492366415635416]
科学シミュレーションにおける物理統合・異質性認識サロゲートのためのモジュール型ディープラーニングフレームワークPHASEを紹介する。
位相は、異種入力のためのデータ型認識エンコーダと、局所力学からグローバルシステム動作への一貫性を促進する多レベル物理ベースの制約を組み合わせる。
我々は,米国エネルギー省のE3SMランドモデル(Energy Exascale Earth System Model)の生物地球化学(BGC)スピンアップワークフロー上でPHASEを検証する。
論文 参考訳(メタデータ) (2025-09-27T18:50:40Z) - Fourier Neural Operator based surrogates for $CO_2$ storage in realistic geologies [57.23978190717341]
我々は,$CO$ plume マイグレーションのリアルタイム・高分解能シミュレーションのためのニューラル演算子(FNO)モデルを開発した。
このモデルは、現実的な地下パラメータから生成された包括的なデータセットに基づいて訓練される。
本稿では,実際の地質学的位置を評価する上で重要なモデルから予測の信頼性を向上させるための様々な戦略を提案する。
論文 参考訳(メタデータ) (2025-03-14T02:58:24Z) - Machine learning Hubbard parameters with equivariant neural networks [0.0]
等変ニューラルネットワークに基づく機械学習モデルを提案する。
ここでは,繰り返し線形応答計算を用いて自己整合的に計算したハバードパラメータの予測を行う。
本モデルでは,Hubbard $U$および$V$パラメータの平均絶対相対誤差を平均3%,5%とする。
論文 参考訳(メタデータ) (2024-06-04T16:21:24Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Maximum Likelihood Learning of Unnormalized Models for Simulation-Based
Inference [44.281860162298564]
シミュレーションベース推論のための2つの合成確率法を提案する。
本研究では,シミュレータによって生成された合成データを用いて,条件付きエネルギーベースモデル(EBM)を学習する。
本研究は, カニの神経科学ネットワークのモデルに適用し, 各種合成データセット上での両手法の特性を実証する。
論文 参考訳(メタデータ) (2022-10-26T14:38:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。