論文の概要: Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery
- arxiv url: http://arxiv.org/abs/2508.17380v1
- Date: Sun, 24 Aug 2025 14:34:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.494541
- Title: Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery
- Title(参考訳): 物理学者の眼を模倣する:物理フォーミュラ発見のためのVLM中心のアプローチ
- Authors: Jiaqi Liu, Songning Lai, Pengze Li, Di Yu, Wenjie Zhou, Yiyang Zhou, Peng Xia, Zijun Wang, Xi Chen, Shixiang Tang, Lei Bai, Wanli Ouyang, Mingyu Ding, Huaxiu Yao, Aoran Wang,
- Abstract要約: VIPERR-aq1は、方程式推論のための視覚誘導を行うマルチモーダルモデルである。
視覚知覚、軌跡データ、象徴的推論を統合し、科学的発見過程をエミュレートする。
常に最先端のVLMベースラインを精度と解釈性で上回る。
- 参考スコア(独自算出の注目度): 98.58830663687911
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated discovery of physical laws from observational data in the real world is a grand challenge in AI. Current methods, relying on symbolic regression or LLMs, are limited to uni-modal data and overlook the rich, visual phenomenological representations of motion that are indispensable to physicists. This "sensory deprivation" severely weakens their ability to interpret the inherent spatio-temporal patterns within dynamic phenomena. To address this gap, we propose VIPER-R1, a multimodal model that performs Visual Induction for Physics-based Equation Reasoning to discover fundamental symbolic formulas. It integrates visual perception, trajectory data, and symbolic reasoning to emulate the scientific discovery process. The model is trained via a curriculum of Motion Structure Induction (MSI), using supervised fine-tuning to interpret kinematic phase portraits and to construct hypotheses guided by a Causal Chain of Thought (C-CoT), followed by Reward-Guided Symbolic Calibration (RGSC) to refine the formula structure with reinforcement learning. During inference, the trained VIPER-R1 acts as an agent: it first posits a high-confidence symbolic ansatz, then proactively invokes an external symbolic regression tool to perform Symbolic Residual Realignment (SR^2). This final step, analogous to a physicist's perturbation analysis, reconciles the theoretical model with empirical data. To support this research, we introduce PhysSymbol, a new 5,000-instance multimodal corpus. Experiments show that VIPER-R1 consistently outperforms state-of-the-art VLM baselines in accuracy and interpretability, enabling more precise discovery of physical laws. Project page: https://jiaaqiliu.github.io/VIPER-R1/
- Abstract(参考訳): 実世界の観測データから物理法則の自動発見は、AIの大きな課題である。
シンボリック回帰(LLM)に依存する現在の手法はユニモーダルデータに限られており、物理学者にとって欠かせない動きのリッチで視覚的な現象論的表現を見落としている。
この「感覚的剥奪」は、動的現象の中で固有の時空間パターンを解釈する能力を著しく弱める。
このギャップに対処するために,物理に基づく方程式推論のための視覚誘導を行うマルチモーダルモデルVIPER-R1を提案する。
視覚知覚、軌跡データ、象徴的推論を統合し、科学的発見過程をエミュレートする。
このモデルは、運動構造誘導(MSI)のカリキュラムを用いて訓練され、教師付き微調整を用いてキネマティック位相像を解釈し、C-CoT(Causal Chain of Thought)によって導かれる仮説を構築し、次にReward-Guided Symbolic Calibration(RGSC)を用いて強化学習により公式構造を洗練させる。
推論中、トレーニングされたVIPER-R1はエージェントとして働き、まず高信頼のシンボルアンサッツを仮定し、その後、外部のシンボルレグレッションツールを積極的に呼び出し、シンボリック・リサイダー・アライメント(SR^2)を実行する。
この最後のステップは、物理学者の摂動解析に類似しており、理論モデルを経験的なデータで再現する。
本研究を支援するために,新しい5,000インスタンスマルチモーダルコーパスであるPhysSymbolを紹介する。
実験の結果、VIPER-R1は最先端のVLMベースラインよりも精度と解釈性が優れており、物理法則のより正確な発見を可能にしている。
プロジェクトページ: https://jiaaqiliu.github.io/VIPER-R1/
関連論文リスト
- Universal Physics Simulation: A Foundational Diffusion Approach [0.0]
境界条件データから直接物理法則を学習する普遍物理学シミュレーションのための最初の基礎的AIモデルを提案する。
本手法は,シミュレーションを条件付き生成問題として扱うことにより,計算物理を再現する。
繰り返しにわたってエラーを蓄積するシーケンシャルなタイムステッピングメソッドとは異なり、私たちのアプローチは時間的統合を完全にバイパスします。
論文 参考訳(メタデータ) (2025-07-13T18:12:34Z) - Inferring Interpretable Models of Fragmentation Functions using Symbolic Regression [10.091537548478655]
本稿では, 実験データから直接, フラグメンテーション関数の関数形式を推定する最初の研究について述べる。
この研究は、QCD関連の現象学研究や、より一般的には科学に追従するアプローチである。
論文 参考訳(メタデータ) (2025-01-13T08:25:14Z) - A Phenomenological AI Foundation Model for Physical Signals [1.204553980682492]
我々は0.59億のクロスモーダルセンサ測定のモデルを開発し、訓練する。
物理法則や帰納バイアスに関する事前の知識はモデルに導入されなかった。
一つの基礎モデルが物理的挙動を効果的にエンコードし予測できることを実証する。
論文 参考訳(メタデータ) (2024-10-15T21:03:53Z) - PhyRecon: Physically Plausible Neural Scene Reconstruction [81.73129450090684]
PHYRECONは、微分可能なレンダリングと微分可能な物理シミュレーションの両方を利用して暗黙的な表面表現を学習する最初のアプローチである。
この設計の中心は、SDFに基づく暗黙の表現と明示的な表面点の間の効率的な変換である。
また,物理シミュレータの安定性も向上し,全データセットに対して少なくとも40%の改善が得られた。
論文 参考訳(メタデータ) (2024-04-25T15:06:58Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。