論文の概要: Summary Statistics of Large-scale Model Outputs for Observation-corrected Outputs
- arxiv url: http://arxiv.org/abs/2506.15845v1
- Date: Wed, 18 Jun 2025 19:49:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:04.831123
- Title: Summary Statistics of Large-scale Model Outputs for Observation-corrected Outputs
- Title(参考訳): 観測補正出力のための大規模モデル出力の概略統計
- Authors: Atlanta Chakraborty, Julie Bessac,
- Abstract要約: Sig-PCAは、モデル出力からの要約統計とニューラルネットワーク(NN)による局所的な観測を統合した時空フレームワークである。
この枠組みは、観測データとモデル出力の統計的要約の相乗効果を強調し、本質的な統計情報を保存することで、マルチソースデータを効果的に組み合わせている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physics-based models capture broad spatial and temporal dynamics, but often suffer from biases and numerical approximations, while observations capture localized variability but are sparse. Integrating these complementary data modalities is important to improving the accuracy and reliability of model outputs. Meanwhile, physics-based models typically generate large outputs that are challenging to manipulate. In this paper, we propose Sig-PCA, a space-time framework that integrates summary statistics from model outputs with localized observations via a neural network (NN). By leveraging reduced-order representations from physics-based models and integrating them with observational data, our approach corrects model outputs, while allowing to work with dimensionally-reduced quantities hence with smaller NNs. This framework highlights the synergy between observational data and statistical summaries of model outputs, and effectively combines multisource data by preserving essential statistical information. We demonstrate our approach on two datasets (surface temperature and surface wind) with different statistical properties and different ratios of model to observational data. Our method corrects model outputs to align closely with the observational data, specifically enabling to correct probability distributions and space-time correlation structures.
- Abstract(参考訳): 物理学に基づくモデルは広い空間的・時間的ダイナミクスを捉えるが、しばしばバイアスや数値近似に悩まされる。
これらの相補的なデータモダリティを統合することは、モデルの出力の正確性と信頼性を向上させるために重要である。
一方、物理学に基づくモデルでは、操作が難しい大きな出力を生成するのが一般的である。
本稿では、モデル出力からの要約統計とニューラルネットワーク(NN)による局所的な観測を統合する時空間フレームワークSig-PCAを提案する。
物理モデルからの低次表現を活用し、観測データと統合することにより、モデル出力を補正し、従って、より小さなNNで次元的に再現された量で作業することが可能となる。
この枠組みは、観測データとモデル出力の統計的要約の相乗効果を強調し、本質的な統計情報を保存することで、マルチソースデータを効果的に組み合わせている。
観測データとモデルとの比の異なる2つのデータセット(地表面温度と地表面風)に対するアプローチを実証する。
本手法は,観測データに忠実なモデル出力を補正し,確率分布と時空間相関構造を補正する。
関連論文リスト
- On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - State-observation augmented diffusion model for nonlinear assimilation with unknown dynamics [6.682908186025083]
データ駆動同化のための新しい生成モデルであるState-Observation Augmented Diffusion(SOAD)モデルを提案する。
実験の結果、SOADは既存のデータ駆動方式と比較してパフォーマンスが向上する可能性が示唆されている。
論文 参考訳(メタデータ) (2024-07-31T03:47:20Z) - Quantifying Distribution Shifts and Uncertainties for Enhanced Model Robustness in Machine Learning Applications [0.0]
本研究では,合成データを用いたモデル適応と一般化について検討する。
我々は、データ類似性を評価するために、Kullback-Leiblerの発散、Jensen-Shannon距離、Mahalanobis距離などの量的尺度を用いる。
本研究は,マハラノビス距離などの統計指標を用いて,モデル予測が低誤差の「補間体制」内にあるか,あるいは高誤差の「補間体制」が分布変化とモデル不確実性を評価するための補完的手法を提供することを示唆している。
論文 参考訳(メタデータ) (2024-05-03T10:05:31Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - The Underlying Scaling Laws and Universal Statistical Structure of Complex Datasets [2.07180164747172]
実世界の複雑なデータセットと人工的に生成されたデータセットの両方に現れる普遍的特性について検討する。
我々のアプローチは、データを物理系に類似させ、統計物理学やランダム行列理論(RMT)のツールを用いて、その基盤となる構造を明らかにすることである。
論文 参考訳(メタデータ) (2023-06-26T18:01:47Z) - Scalable Statistical Inference of Photometric Redshift via Data
Subsampling [0.3222802562733786]
ビッグデータの処理は、従来の統計モデルでは大きなボトルネックとなっている。
統計モデルのアンサンブルからの不確実性を結合したデータ駆動統計モデリングフレームワークを開発する。
この手法を宇宙論における光度赤方位推定問題で実証する。
論文 参考訳(メタデータ) (2021-03-30T02:49:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。