論文の概要: Agentic Physical AI toward a Domain-Specific Foundation Model for Nuclear Reactor Control
- arxiv url: http://arxiv.org/abs/2512.23292v2
- Date: Tue, 06 Jan 2026 02:29:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 13:14:29.345058
- Title: Agentic Physical AI toward a Domain-Specific Foundation Model for Nuclear Reactor Control
- Title(参考訳): 原子炉制御のためのドメイン特異的基礎モデルに向けたエージェント物理AI
- Authors: Yoonpyo Lee, Kazuma Kobayashi, Sai Puppala, Sajedul Talukder, Seid Koric, Souvik Chakraborty, Syed Bahauddin Alam,
- Abstract要約: 最近のベンチマークでは、視覚言語モデルは基本的な量物理学のタスクで50~53%の精度しか達成していない。
パーセプション中心のアーキテクチャはパラメータ空間の模倣を最適化するが、セーフティクリティカルな制御は結果空間の保証を要求する。
本稿では,エージェント物理AIとして動作するコンパクト言語モデルを導入することにより,ドメイン固有基盤モデルに対する根本的に異なる経路を示す。
- 参考スコア(独自算出の注目度): 3.9610256846446554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prevailing paradigm in AI for physical systems, scaling general-purpose foundation models toward universal multimodal reasoning, confronts a fundamental barrier at the control interface. Recent benchmarks show that even frontier vision-language models achieve only 50-53% accuracy on basic quantitative physics tasks, behaving as approximate guessers that preserve semantic plausibility while violating physical constraints. This input unfaithfulness is not a scaling deficiency but a structural limitation. Perception-centric architectures optimize parameter-space imitation, whereas safety-critical control demands outcome-space guarantees over executed actions. Here, we present a fundamentally different pathway toward domain-specific foundation models by introducing compact language models operating as Agentic Physical AI, in which policy optimization is driven by physics-based validation rather than perceptual inference. We train a 360-million-parameter model on synthetic reactor control scenarios, scaling the dataset from 10^3 to 10^5 examples. This induces a sharp phase transition absent in general-purpose models. Small-scale systems exhibit high-variance imitation with catastrophic tail risk, while large-scale models undergo variance collapse exceeding 500x reduction, stabilizing execution-level behavior. Despite balanced exposure to four actuation families, the model autonomously rejects approximately 70% of the training distribution and concentrates 95% of runtime execution on a single-bank strategy. Learned representations transfer across distinct physics and continuous input modalities without architectural modification.
- Abstract(参考訳): 物理システムにおけるAIの主流パラダイムは、汎用基盤モデルを普遍的なマルチモーダル推論に拡張することであり、コントロールインターフェースにおける基本的な障壁に直面している。
最近のベンチマークでは、フロンティア視覚言語モデルでさえ、物理的な制約を破りながら意味論的妥当性を保った近似的な推測器として、基本的な量的物理学のタスクにおいてわずか50~53%の精度しか達成していないことが示されている。
この入力不誠実さはスケーリング不足ではなく、構造的制限である。
パーセプション中心のアーキテクチャはパラメータ空間の模倣を最適化するが、セーフティクリティカルな制御は実行されたアクションに対して結果空間の保証を要求する。
本稿では、エージェント物理AIとして動作するコンパクト言語モデルを導入することにより、ドメイン固有の基礎モデルに対する基本的な経路を提示する。
合成反応器制御のシナリオで360万パラメータモデルをトレーニングし,データセットを10^3から10^5の例に拡張した。
これにより、汎用モデルに存在しない鋭い位相遷移が引き起こされる。
小規模システムは破滅的な尾のリスクを伴う高分散模倣を示す一方、大規模モデルは500倍の縮小を達成し、実行レベルの挙動を安定化させる。
4つのアクチュエーターファミリへのバランスの取れた露出にもかかわらず、このモデルはトレーニングディストリビューションの約70%を自律的に拒否し、実行時の95%を単一バンク戦略に集中させる。
学習された表現は、異なる物理と連続的な入力モダリティをアーキテクチャの変更なしに伝達する。
関連論文リスト
- Benchmarking neural surrogates on realistic spatiotemporal multiphysics flows [18.240532888032394]
我々は、困難でアプリケーション駆動のリアクティブフローでニューラルネットワークサロゲートをテストするために設計された厳格なベンチマークフレームワークであるREALM(Realistic AI Learning for Multiphysics)を提案する。
我々は、スペクトル演算子、畳み込みモデル、トランスフォーマー、ポイントワイド演算子、グラフ/メッシュネットワークを含む、12以上の代表代理モデルファミリをベンチマークする。
i)次元性、剛性、メッシュの不規則性によって共同で管理されるスケーリング障壁により、ロールアウトエラーが急速に増加すること、(ii)パラメータカウントよりもアーキテクチャ上の帰納バイアスによって主に制御されるパフォーマンス、(iii)精度の指標と物理的にの間にある永続的なギャップ、の3つの頑健な傾向を識別する。
論文 参考訳(メタデータ) (2025-12-21T05:04:13Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - Flow marching for a generative PDE foundation model [0.0]
本稿では,物理力学系における誤り蓄積の解析によって動機付けられたフローマッチングを用いて,ニューラル演算子の学習をブリッジするアルゴリズムであるフローマーチングを提案する。
また,物理制約付き変分オートエンコーダ(P2E)を導入し,物理軌道をコンパクトな潜在空間に埋め込む。
異なる12種類のPDEファミリーおよびP2EとFMTのトレインスイートの2.5Mトラジェクトリを複数スケールでキュレートする。
論文 参考訳(メタデータ) (2025-09-23T04:00:41Z) - Transition Models: Rethinking the Generative Learning Objective [68.16330673177207]
有限時間間隔で状態遷移を解析的に定義する連続時間力学方程式を導入する。
これは、任意のステップ遷移に適応する新しい生成パラダイムである遷移モデル(TiM)をもたらす。
TiMは最先端のパフォーマンスを達成し、SD3.5 (8Bパラメータ)やFLUX.1 (12Bパラメータ)といった主要なモデルを超える。
論文 参考訳(メタデータ) (2025-09-04T17:05:59Z) - Learning Robust Satellite Attitude Dynamics with Physics-Informed Normalising Flow [2.7222301668137483]
宇宙機の姿勢力学の学習に物理インフォームドニューラルネットワークを組み込むことの利点について検討する。
バシリスクシミュレータで生成されたシミュレーションデータに基づいて複数のモデルを訓練する。
PINNベースのモデルは、制御精度とロバスト性の観点から、純粋にデータ駆動モデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-11T10:50:49Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - A Hybrid Defense Strategy for Boosting Adversarial Robustness in Vision-Language Models [9.304845676825584]
本稿では,複数の攻撃戦略と高度な機械学習技術を統合した,新たな敵訓練フレームワークを提案する。
CIFAR-10 や CIFAR-100 などの実世界のデータセットで行った実験により,提案手法がモデルロバスト性を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-10-18T23:47:46Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。