論文の概要: Solving Physics Olympiad via Reinforcement Learning on Physics Simulators
- arxiv url: http://arxiv.org/abs/2604.11805v1
- Date: Mon, 13 Apr 2026 17:59:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.748375
- Title: Solving Physics Olympiad via Reinforcement Learning on Physics Simulators
- Title(参考訳): 物理シミュレータの強化学習による物理オリンピックの解法
- Authors: Mihir Prabhudesai, Aryan Satpathy, Yangmin Li, Zheyang Qin, Nikash Bhardwaj, Amir Zadeh, Chuan Li, Katerina Fragkiadaki, Deepak Pathak,
- Abstract要約: 物理シミュレーションは、物理推論のためのLLMのトレーニングのための強力な代替監督源として機能することを示す。
我々のモデルは、実世界の物理ベンチマークにゼロショットのsim-to-real転送を示す。
- 参考スコア(独自算出の注目度): 44.60747141807886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We have witnessed remarkable advances in LLM reasoning capabilities with the advent of DeepSeek-R1. However, much of this progress has been fueled by the abundance of internet question-answer (QA) pairs, a major bottleneck going forward, since such data is limited in scale and concentrated mainly in domains like mathematics. In contrast, other sciences such as physics lack large-scale QA datasets to effectively train reasoning-capable models. In this work, we show that physics simulators can serve as a powerful alternative source of supervision for training LLMs for physical reasoning. We generate random scenes in physics engines, create synthetic question-answer pairs from simulated interactions, and train LLMs using reinforcement learning on this synthetic data. Our models exhibit zero-shot sim-to-real transfer to real-world physics benchmarks: for example, training solely on synthetic simulated data improves performance on IPhO (International Physics Olympiad) problems by 5-10 percentage points across model sizes. These results demonstrate that physics simulators can act as scalable data generators, enabling LLMs to acquire deep physical reasoning skills beyond the limitations of internet-scale QA data. Code available at: https://sim2reason.github.io/.
- Abstract(参考訳): 我々は,DeepSeek-R1の出現に伴うLSM推論能力の顕著な進歩を目撃してきた。
しかし、これらの進歩の多くはインターネット質問応答(QA)ペアの多さに支えられ、これは今後大きなボトルネックとなる。
対照的に、物理学のような他の科学では推論可能なモデルを効果的に訓練するために大規模なQAデータセットが欠落している。
本研究は,物理学シミュレータが物理推論のためのLLMの訓練のための強力な代替的監督源として機能することを示す。
我々は物理エンジンのランダムなシーンを生成し、シミュレーションされた相互作用から合成質問応答ペアを作成し、この合成データを用いた強化学習を用いてLLMを訓練する。
例えば、合成シミュレーションデータのみによるトレーニングは、モデルサイズでIPhO(International Physics Olympiad)問題の性能を5~10ポイント向上させる。
これらの結果は、物理シミュレータがスケーラブルなデータジェネレータとして機能することを示し、LLMはインターネットスケールのQAデータの制限を超えて、深い物理推論技術を習得できることを示した。
コードは、https://sim2reason.github.io/.comで入手できる。
関連論文リスト
- GeoPT: Scaling Physics Simulation via Lifted Geometric Pre-Training [86.70824679370524]
我々は,持ち上げ幾何事前学習に基づく一般物理シミュレーションのための統一事前学習モデルGeoPTを提案する。
中心となる考え方は、幾何学を合成力学で強化し、物理ラベルなしで動的に認識できる自己超越を可能にすることである。
論文 参考訳(メタデータ) (2026-02-23T22:32:08Z) - SimuScene: Training and Benchmarking Code Generation to Simulate Physical Scenarios [71.65387146697319]
大規模言語モデル(LLM)は、数学の競争、複雑なコーディング、科学的推論といったタスクのために広く研究されている。
物理シナリオをシミュレートしてLLMを訓練し,評価する最初の体系的な研究であるSimuSceneを提案する。
品質を保証するために、人間の検証とともに、データ収集のための自動パイプラインを構築します。
論文 参考訳(メタデータ) (2026-02-11T13:26:02Z) - SIMPACT: Simulation-Enabled Action Planning using Vision-Language Models [60.80050275581661]
VLM(Vision-Language Models)は、目覚しい常識と意味論的推論能力を示す。
物理力学に関する基礎的な理解は欠如している。
テストタイムでシミュレーション可能な ACTion Planning フレームワークである S を提案する。
本手法は,5つの難易度,実世界の剛体および変形可能な操作課題に対して,最先端の性能を示す。
論文 参考訳(メタデータ) (2025-12-05T18:51:03Z) - PhysWorld: From Real Videos to World Models of Deformable Objects via Physics-Aware Demonstration Synthesis [52.905353023326306]
物理的に妥当で多様な実演を合成し、効率的な世界モデルを学ぶためのフレームワークであるPhysWorldを提案する。
実験により、PhysWorldは、最新の最先端手法、すなわちPhysTwinよりも47倍高速な推論速度を実現しつつ、競争性能を持つことが示された。
論文 参考訳(メタデータ) (2025-10-24T13:25:39Z) - PhysiX: A Foundation Model for Physics Simulations [27.359872113159405]
物理シミュレーションのための最初の大規模基礎モデルであるPhysorXを紹介する。
PhysiXはデータボトルネックに効果的に対処し、タスク固有のベースラインを上回ります。
その結果,自然ビデオから学んだ知識が物理シミュレーションにうまく移行できることが示唆された。
論文 参考訳(メタデータ) (2025-06-21T18:10:12Z) - Scaling Physical Reasoning with the PHYSICS Dataset [39.960500815534836]
PHYSICSは、被験者と難易度にまたがる16,568の高品質な物理問題を含むデータセットである。
力学、電磁気学、熱力学、光学、現代物理学の5つの分野を網羅している。
また、高校から大学院レベルの物理学コースまで幅広い難易度がある。
論文 参考訳(メタデータ) (2025-05-21T17:06:28Z) - DreamPhysics: Learning Physics-Based 3D Dynamics with Video Diffusion Priors [75.83647027123119]
本稿では,映像拡散前の物体の物理的特性を学習することを提案する。
次に,物理に基づくMaterial-Point-Methodシミュレータを用いて,現実的な動きを伴う4Dコンテンツを生成する。
論文 参考訳(メタデータ) (2024-06-03T16:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。