論文の概要: Physics Steering: Causal Control of Cross-Domain Concepts in a Physics Foundation Model
- arxiv url: http://arxiv.org/abs/2511.20798v2
- Date: Fri, 28 Nov 2025 04:04:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 15:47:02.755975
- Title: Physics Steering: Causal Control of Cross-Domain Concepts in a Physics Foundation Model
- Title(参考訳): 物理ステアリング:物理基礎モデルにおけるクロスドメイン概念の因果制御
- Authors: Rio Alexa Fear, Payel Mukhopadhyay, Michael McCabe, Alberto Bietti, Miles Cranmer,
- Abstract要約: 大規模物理基礎モデルの内部表現について検討する。
推論中に概念の方向をモデルに注入することで、予測を操ることができる。
本研究は,科学基盤モデルの理解と制御のための新たな道を開く。
- 参考スコア(独自算出の注目度): 13.900251746035012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in mechanistic interpretability have revealed that large language models (LLMs) develop internal representations corresponding not only to concrete entities but also distinct, human-understandable abstract concepts and behaviour. Moreover, these hidden features can be directly manipulated to steer model behaviour. However, it remains an open question whether this phenomenon is unique to models trained on inherently structured data (ie. language, images) or if it is a general property of foundation models. In this work, we investigate the internal representations of a large physics-focused foundation model. Inspired by recent work identifying single directions in activation space for complex behaviours in LLMs, we extract activation vectors from the model during forward passes over simulation datasets for different physical regimes. We then compute "delta" representations between the two regimes. These delta tensors act as concept directions in activation space, encoding specific physical features. By injecting these concept directions back into the model during inference, we can steer its predictions, demonstrating causal control over physical behaviours, such as inducing or removing some particular physical feature from a simulation. These results suggest that scientific foundation models learn generalised representations of physical principles. They do not merely rely on superficial correlations and patterns in the simulations. Our findings open new avenues for understanding and controlling scientific foundation models and has implications for AI-enabled scientific discovery.
- Abstract(参考訳): 近年の機械的解釈可能性の進歩により、大規模言語モデル(LLM)は、具体的実体だけでなく、人間の理解可能な抽象概念や振る舞いに対応する内部表現を開発することが明らかとなった。
さらに、これらの隠れた機能は、モデル動作を直接操作することができる。
しかし、この現象は本質的に構造化されたデータ(例えば、言語、画像)で訓練されたモデルに固有のものなのか、あるいは基礎モデルの一般的な性質なのかは、未解決のままである。
本研究では,大規模物理基礎モデルの内部表現について検討する。
LLMにおける複雑な振る舞いに対する活性化空間の単一方向を同定する最近の研究から着想を得て,各物理状態のシミュレーションデータセット上で前方通過時のモデルからアクティベーションベクトルを抽出する。
次に、2つのレジーム間の「デルタ」表現を計算する。
これらのデルタテンソルは活性化空間における概念方向として作用し、特定の物理的特徴を符号化する。
推論中にこれらの概念の方向をモデルに注入することにより、予測を操り、シミュレーションから特定の物理的特徴を誘導または除去するなどの身体行動に対する因果制御を示すことができる。
これらの結果は、科学基盤モデルが物理原理の一般化された表現を学ぶことを示唆している。
これらは単に表面的相関やシミュレーションのパターンにのみ依存するわけではない。
我々の発見は、科学基盤モデルの理解と制御のための新たな道を開き、AIによる科学的発見に影響を及ぼす。
関連論文リスト
- Mimicking the Physicist's Eye:A VLM-centric Approach for Physics Formula Discovery [98.58830663687911]
VIPERR-aq1は、方程式推論のための視覚誘導を行うマルチモーダルモデルである。
視覚知覚、軌跡データ、象徴的推論を統合し、科学的発見過程をエミュレートする。
常に最先端のVLMベースラインを精度と解釈性で上回る。
論文 参考訳(メタデータ) (2025-08-24T14:34:21Z) - SlotPi: Physics-informed Object-centric Reasoning Models [37.32107835829927]
物理インフォームドオブジェクト中心推論モデルであるSlotPiを紹介する。
我々の実験は、ベンチマークや流体データセット上での予測や視覚質問応答(VQA)といったタスクにおけるモデルの強みを強調した。
我々は、オブジェクトの相互作用、流体力学、流体オブジェクトの相互作用を含む実世界のデータセットを作成し、モデルの性能を検証した。
論文 参考訳(メタデータ) (2025-06-12T14:53:36Z) - A Phenomenological AI Foundation Model for Physical Signals [1.204553980682492]
我々は0.59億のクロスモーダルセンサ測定のモデルを開発し、訓練する。
物理法則や帰納バイアスに関する事前の知識はモデルに導入されなかった。
一つの基礎モデルが物理的挙動を効果的にエンコードし予測できることを実証する。
論文 参考訳(メタデータ) (2024-10-15T21:03:53Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Disentangling Shape and Pose for Object-Centric Deep Active Inference
Models [4.298360054690217]
本稿では,3次元オブジェクト表現の問題点を考察し,ShapeNetデータセットの異なるインスタンスに着目した。
深層ニューラルネットワークを用いて各因子の表現を学習しながら,対象の形状,ポーズ,カテゴリを分解するモデルを提案する。
論文 参考訳(メタデータ) (2022-09-16T12:53:49Z) - Which priors matter? Benchmarking models for learning latent dynamics [70.88999063639146]
古典力学の先行概念を機械学習モデルに統合する手法が提案されている。
これらのモデルの現在の機能について、精査する。
連続的および時間的可逆的ダイナミクスの使用は、すべてのクラスのモデルに恩恵をもたらす。
論文 参考訳(メタデータ) (2021-11-09T23:48:21Z) - Physics-guided Deep Markov Models for Learning Nonlinear Dynamical
Systems with Uncertainty [6.151348127802708]
我々は物理誘導型Deep Markov Model(PgDMM)という物理誘導型フレームワークを提案する。
提案手法は,動的システムの駆動物理を維持しながら,ディープラーニングの表現力を利用する。
論文 参考訳(メタデータ) (2021-10-16T16:35:12Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z) - A physics-informed operator regression framework for extracting
data-driven continuum models [0.0]
高忠実度分子シミュレーションデータから連続体モデルを発見するためのフレームワークを提案する。
提案手法は、モーダル空間における制御物理のニューラルネットワークパラメタライゼーションを適用する。
局所・非局所拡散過程や単相・多相流など,様々な物理分野におけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-09-25T01:13:51Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。