論文の概要: PhysInOne: Visual Physics Learning and Reasoning in One Suite
- arxiv url: http://arxiv.org/abs/2604.09415v1
- Date: Fri, 10 Apr 2026 15:27:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.932023
- Title: PhysInOne: Visual Physics Learning and Reasoning in One Suite
- Title(参考訳): PhysInOne - One Suiteにおける視覚物理学習と推論
- Authors: Siyuan Zhou, Hejun Wang, Hu Cheng, Jinxi Li, Dongsheng Wang, Junwei Jiang, Yixiao Jin, Jiayue Huang, Shiwei Mao, Shangjia Liu, Yafei Yang, Hongkang Song, Shenxing Wei, Zihui Zhang, Peng Huang, Shijie Liu, Zhengli Hao, Hao Li, Yitian Li, Wenqi Zhou, Zhihan Zhao, Zongqi He, Hongtao Wen, Shouwang Huang, Peng Yun, Bowen Cheng, Pok Kazaf Fu, Wai Kit Lai, Jiahao Chen, Kaiyuan Wang, Zhixuan Sun, Ziqi Li, Haochen Hu, Di Zhang, Chun Ho Yuen, Bing Wang, Zhihua Wang, Chuhang Zou, Bo Yang,
- Abstract要約: 我々は、AIシステムのための物理地上トレーニングデータの致命的な不足に対処する大規模な合成データセットであるPhysInOneを提示する。
数百から数千のサンプルに制限された既存のデータセットとは異なり、PhysInOneは153,810のダイナミックな3Dシーンに200万のビデオを提供する。
我々はPhysInOneの有効性を、物理対応ビデオ生成、長期・短期のフレーム予測、物理的特性推定、モーション転送の4つの新しいアプリケーションで実証する。
- 参考スコア(独自算出の注目度): 41.08902311182402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present PhysInOne, a large-scale synthetic dataset addressing the critical scarcity of physically-grounded training data for AI systems. Unlike existing datasets limited to merely hundreds or thousands of examples, PhysInOne provides 2 million videos across 153,810 dynamic 3D scenes, covering 71 basic physical phenomena in mechanics, optics, fluid dynamics, and magnetism. Distinct from previous works, our scenes feature multiobject interactions against complex backgrounds, with comprehensive ground-truth annotations including 3D geometry, semantics, dynamic motion, physical properties, and text descriptions. We demonstrate PhysInOne's efficacy across four emerging applications: physics-aware video generation, long-/short-term future frame prediction, physical property estimation, and motion transfer. Experiments show that fine-tuning foundation models on PhysInOne significantly enhances physical plausibility, while also exposing critical gaps in modeling complex physical dynamics and estimating intrinsic properties. As the largest dataset of its kind, orders of magnitude beyond prior works, PhysInOne establishes a new benchmark for advancing physics-grounded world models in generation, simulation, and embodied AI.
- Abstract(参考訳): 我々は、AIシステムのための物理地上トレーニングデータの致命的な不足に対処する大規模な合成データセットであるPhysInOneを提示する。
PhysInOneは、数百から数千のサンプルに制限された既存のデータセットとは異なり、153,810のダイナミックな3Dシーンで200万本のビデオを提供しており、力学、光学、流体力学、磁気学の71の基本的な物理現象をカバーしている。
これまでの作品とは違って,3次元幾何学,意味論,動的運動,物理特性,テキスト記述など,複雑な背景に対する多目的インタラクションが特徴である。
我々はPhysInOneの有効性を、物理対応ビデオ生成、長期・短期のフレーム予測、物理的特性推定、モーション転送の4つの新しいアプリケーションで実証する。
実験により、PhysInOneの微調整基礎モデルは、複雑な物理力学をモデル化し、固有特性を推定する上で重要なギャップを顕在化しつつ、物理的可視性を著しく向上させることが示された。
PhysInOneは、その種類の最大のデータセットであり、前作よりも桁違いのオーダーで、生成、シミュレーション、そして具体化されたAIで物理地上の世界モデルを進化させるための、新しいベンチマークを確立した。
関連論文リスト
- PhysChoreo: Physics-Controllable Video Generation with Part-Aware Semantic Grounding [50.454084539837005]
PhysChoreoは、単一の画像から多様な制御性と物理的なリアリズムを持つビデオを生成する新しいフレームワークである。
本手法は2つの段階から構成される: まず, 画像中の全ての物体の静的初期特性を, 部分認識の物理的特性再構成により推定する。
そして、時間的に指示され、物理的に編集可能なシミュレーションを通じて、リッチな動的な振る舞いと物理的なリアリズムで高品質な動画を合成する。
論文 参考訳(メタデータ) (2025-11-25T17:59:04Z) - PhysX-Anything: Simulation-Ready Physical 3D Assets from Single Image [67.76547268461411]
PhysX-Anythingは最初のシミュレーション可能な物理3D生成フレームワークである。
高品質なsim-ready 3Dアセットを明示的な幾何学、調音、物理的特性で生成する。
トークンの数を193倍に減らし、標準VLMトークン予算内で明示的な幾何学的学習を可能にする。
論文 参考訳(メタデータ) (2025-11-17T17:59:53Z) - PhysWorld: From Real Videos to World Models of Deformable Objects via Physics-Aware Demonstration Synthesis [52.905353023326306]
物理的に妥当で多様な実演を合成し、効率的な世界モデルを学ぶためのフレームワークであるPhysWorldを提案する。
実験により、PhysWorldは、最新の最先端手法、すなわちPhysTwinよりも47倍高速な推論速度を実現しつつ、競争性能を持つことが示された。
論文 参考訳(メタデータ) (2025-10-24T13:25:39Z) - PhysGaia: A Physics-Aware Dataset of Multi-Body Interactions for Dynamic Novel View Synthesis [62.283499219361595]
PhysGaiaは動的ノベルビュー合成(DyNVS)のために設計された物理対応のデータセットである。
私たちのデータセットは、複数のオブジェクト間のリッチな相互作用を伴う複雑な動的シナリオを提供します。
PhysGaiaは、動的ビュー合成、物理に基づくシーン理解、および物理シミュレーションと統合されたディープラーニングモデルの研究を著しく前進させる。
論文 参考訳(メタデータ) (2025-06-03T12:19:18Z) - Physics3D: Learning Physical Properties of 3D Gaussians via Video Diffusion [35.71595369663293]
ビデオ拡散モデルを用いて3Dオブジェクトの様々な物理的特性を学習する新しい手法である textbfPhysics3D を提案する。
本手法では,粘弾性材料モデルに基づく高一般化物理シミュレーションシステムを設計する。
弾性材料とプラスチック材料の両方を用いて, 本手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-06-06T17:59:47Z) - PhysDreamer: Physics-Based Interaction with 3D Objects via Video Generation [62.53760963292465]
PhysDreamerは物理に基づくアプローチで、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える。
本稿では, 弾性物体の多様な例について考察し, ユーザスタディを通じて合成された相互作用の現実性を評価する。
論文 参考訳(メタデータ) (2024-04-19T17:41:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。