論文の概要: IPR-1: Interactive Physical Reasoner
- arxiv url: http://arxiv.org/abs/2511.15407v1
- Date: Wed, 19 Nov 2025 13:04:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.808892
- Title: IPR-1: Interactive Physical Reasoner
- Title(参考訳): IPR-1:インタラクティブ物理共振器
- Authors: Mingyu Zhang, Lifeng Zhuo, Tianxi Tan, Guocan Xie, Xian Nie, Yan Li, Renjie Zhao, Zizhu He, Ziyu Wang, Jiting Cai, Yong-Lu Li,
- Abstract要約: 我々は、エージェントが同様に人間的な推論を対話から獲得し、より多くの経験を積んで改善できるかどうかを問うことを目的とする。
我々はこれをG2U(Game-to-Unseen)設定で研究し、多種多様な物理・因果機構を持つ1000以上の異種ゲームをキュレートする。
- 参考スコア(独自算出の注目度): 12.534108491269954
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans learn by observing, interacting with environments, and internalizing physics and causality. Here, we aim to ask whether an agent can similarly acquire human-like reasoning from interaction and keep improving with more experience. We study this in a Game-to-Unseen (G2U) setting, curating 1,000+ heterogeneous games with diverse physical and causal mechanisms, and evaluate at three human-like levels: Survival, Curiosity, Utility, from primitive intuition to goal-driven reasoning. Our analysis reveals complementary failures: VLM/VLA agents reason but lack look-ahead in interactive settings, while world models imagine but imitate visual patterns rather than analyze physics and causality. We therefore propose IPR (Interactive Physical Reasoner), using world-model rollouts to score and reinforce a VLM's policy, and introduce PhysCode, a physics-centric action code aligning semantic intent with dynamics to provide a shared action space for prediction and reasoning. Pretrained on 1,000+ games, our IPR performs robustly on three levels, matches GPT-5 overall, and surpasses it on Curiosity. We find that performance improves with more training games and interaction steps, and that the model also zero-shot transfers to unseen games. These results support physics-centric interaction as a path to steadily improving physical reasoning.
- Abstract(参考訳): 人間は、観察、環境との相互作用、物理と因果関係の内在化によって学習する。
ここでは、エージェントが同様に人間的な推論を対話から獲得し、より多くの経験を積んで改善できるかどうかを問う。
我々は、これをG2U(Game-to-Unseen)設定で研究し、様々な物理的・因果メカニズムを持つ1,000以上の異種ゲームをキュレートし、原始的な直観からゴール駆動的推論に至るまで、生存性、好奇性、実用性という3つの人間的なレベルで評価する。
VLM/VLAエージェントは理にかなっているが、対話的な設定では目立たずである一方、世界モデルは物理や因果関係を解析するのではなく、視覚パターンを模倣する。
そこで我々は,世界モデルロールアウトを用いてVLMのポリシーを採点し,強化するIRP(Interactive Physical Reasoner)を提案し,物理中心のアクションコードであるPhysCodeを紹介した。
1000以上のゲームで事前トレーニングされた当社のIPRは、3つのレベルで堅牢に動作し、GPT-5全体と一致し、Curiosityでそれを上回ります。
トレーニングゲームやインタラクションステップの強化によってパフォーマンスが向上し,ゼロショットのゲームへの転送も可能になった。
これらの結果は、物理推論を着実に改善する道として物理学中心の相互作用を支持する。
関連論文リスト
- WoW: Towards a World omniscient World model Through Embodied Interaction [83.43543124512719]
世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。
このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。
WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文 参考訳(メタデータ) (2025-09-26T17:59:07Z) - Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning [77.6397528430433]
物理世界を理解し、適切な具体的決定を生成する物理AIモデルを提案する。
物理的常識を表現するために、空間、時間、物理学に関する基本的な知識を捉える階層的オントロジーを用いる。
具体的推論では、異なる物理的実施形態をまたいで一般化する2次元オントロジーに依存している。
論文 参考訳(メタデータ) (2025-03-18T22:06:58Z) - PhysHOI: Physics-Based Imitation of Dynamic Human-Object Interaction [22.48933099236595]
本稿では,PhysHOIについて述べる。PhysHOIは,タスク固有の報酬設計を伴わない物理ベースの全体HOI模倣手法である。
人や物体のキネマティックHOI表現以外は、接触グラフを導入し、身体部分と物体との接触関係を明示的にモデル化する。
鍵となる設計に基づいて、PhysHOIは様々なHOIタスクを模倣できる。
論文 参考訳(メタデータ) (2023-12-07T16:06:31Z) - Measuring and Modeling Physical Intrinsic Motivation [4.995872423496944]
人間は対話的なエージェントであり、興味深い物理力学を持つ状況を探し出す。
私たちはまず、人間が様々な物理シナリオをいかに興味深いかの格付けを集めます。
そこで本研究では,本質的な動機づけの様々な仮説を実装し,人間の興味ある反応をモデル化する。
論文 参考訳(メタデータ) (2023-05-22T19:52:08Z) - Use the Force, Luke! Learning to Predict Physical Forces by Simulating
Effects [79.351446087227]
物体と相互作用する人間の映像から接触点と物理的力の推測の問題に対処する。
具体的には、シミュレーションを用いて効果を予測し、推定された力がビデオに描かれたものと同じ効果をもたらすことを強制する。
論文 参考訳(メタデータ) (2020-03-26T17:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。