論文の概要: Do Physics Foundation Models Learn Generalizable Physics? A Bias-Aware Benchmark Across Physical Regimes and Distribution Shifts
- arxiv url: http://arxiv.org/abs/2605.29283v1
- Date: Thu, 28 May 2026 03:08:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.606109
- Title: Do Physics Foundation Models Learn Generalizable Physics? A Bias-Aware Benchmark Across Physical Regimes and Distribution Shifts
- Title(参考訳): 物理基礎モデルは一般化可能な物理を学ぶか? -物理レジームと分布シフトのベンチマーク-
- Authors: Mengdi Chu, Yang Liu, Ayan Biswas, Han-Wei Shen,
- Abstract要約: 最近の物理基礎モデルでは、一般的な時間予測能力が主張されているが、その評価は固定されたトレーニング分布の下で1つの平均スコアに崩壊する。
これにより、モデルが一般的な物理力学を学習したのか、特定の設定下でのみうまく機能したのかを判断することが困難になる。
8つの物理ダイナミックス3のトレーニングデータ混合と、動的スケールと初期条件の複雑さによって誘導される25のテストレギュレーションを用いたベンチマークを構築した。
- 参考スコア(独自算出の注目度): 32.56667671508667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent physics foundation models claim general spatiotemporal forecasting ability, yet their evaluations often collapse performance into a single average score under a fixed training distribution. This makes it difficult to determine whether a model has learned generalizable physical dynamics or only performs well under particular settings. We construct a benchmark with 8 physical dynamics, 3 training-data mixtures, and 25 test regimes induced by dynamic-scale and initial-condition complexity shifts, covering in-distribution, distribution-shift, and out-of-distribution settings. We evaluate five physics foundation model architectures and four model variants per architecture (scratch and three pretrained sizes), resulting in 60,000 measurements. Our results show that current physics foundation models behave as conditional rather than universal generalists: their generality depends on the physical regime, temporal scale, initial-condition setting, pretraining, model size, and architecture. Improving the training data distribution only partially mitigates this limitation. Pretraining and scaling are also unable to reliably remove their ability biases. We argue that improving physics foundation models requires moving beyond scaling models or expanding data, toward learning mechanisms that better capture transferable physical knowledge across regimes, temporal scales, and distribution shifts.
- Abstract(参考訳): 最近の物理基礎モデルでは、一般的な時空間予測能力が主張されているが、それらの評価は、固定されたトレーニング分布の下で、パフォーマンスを1つの平均スコアに分解することが多い。
これにより、モデルが一般化可能な物理力学を学習したのか、あるいは特定の設定下でのみうまく機能したのかを判断することが困難になる。
本研究では,8つの物理力学,3つのトレーニングデータ混合,および動的スケールおよび初期条件の複雑性シフトによって引き起こされる25の試験規則を用いたベンチマークを構築した。
5つの物理基礎モデルアーキテクチャと4つのモデル変種(スクラッチと3つの事前訓練済みサイズ)を評価し、6万の測定結果を得た。
その結果、現在の物理基礎モデルは一般の一般論者よりも条件として振る舞うことが示され、それらの一般性は、物理状態、時間スケール、初期条件設定、事前学習、モデルサイズ、アーキテクチャに依存する。
トレーニングデータの配布を改善することは、この制限を緩和するだけである。
事前トレーニングとスケーリングは、その能力バイアスを確実に除去することができない。
物理基盤モデルの改善には、モデルをスケールしたり、データを拡張したり、レジーム、時間スケール、分散シフトをまたいで、伝達可能な物理的知識をよりよく捉えるための学習メカニズムに移行する必要がある、と我々は主張する。
関連論文リスト
- PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference [57.086932851733145]
ビデオ拡散モデルにおける直感的な物理を評価するトレーニング不要な方法であるLikePhysを紹介した。
現在のビデオ拡散モデルにおける直観的物理理解のベンチマークを行う。
経験的結果は、現在のモデルが複雑でカオス的な力学に苦しむにもかかわらず、モデルキャパシティと推論設定スケールとしての物理理解の改善傾向が明らかであることを示している。
論文 参考訳(メタデータ) (2025-10-13T15:19:07Z) - Towards a Physics Foundation Model [2.109902626434734]
シミュレーションデータの1.8TBをトレーニングした一般物理変換器(GPhyT)について述べる。
GPhyTは複数の物理領域にまたがる優れた性能を実現し、特殊アーキテクチャを最大29倍の性能で上回る。
単一のモデルがデータだけで一般的な物理原理を学習できることを確立することで、この研究は普遍的な物理基礎モデルへの道を開く。
論文 参考訳(メタデータ) (2025-09-17T08:19:57Z) - BeamVQ: Aligning Space-Time Forecasting Model via Self-training on Physics-aware Metrics [18.67368024029461]
本研究では、ベクトル量子化(BeamVQ)によるemphBeam探索を提案し、データ駆動時空予測モデルの物理的アライメントを強化する。
BeamVQは、物理を意識したメトリクスでフィルタリングされた自己生成サンプルのモデルを訓練する。
実験によると、BeamVQは5つのデータセットで10のバックボーンに対して平均的な統計スキルスコアを32%以上向上させただけでなく、物理学を意識したメトリクスを大幅に強化した。
論文 参考訳(メタデータ) (2024-05-27T11:07:47Z) - Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.13352174687475]
本稿では,天気予報をトレーニングデータセットを超える微細な時間スケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
また、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークも導入する。
論文 参考訳(メタデータ) (2024-05-22T16:21:02Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z) - Differentiable Physics Models for Real-world Offline Model-based
Reinforcement Learning [34.558299591341]
モデルに基づく強化学習の制限は、学習モデルにおけるエラーの活用である。
物理モデルを用いたモデルは,機械構造が知られている場合,高容量関数近似器と比較して有益であることを示す。
論文 参考訳(メタデータ) (2020-11-03T14:37:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。