論文の概要: Objects in Generated Videos Are Slower Than They Appear: Models Suffer Sub-Earth Gravity and Don't Know Galileo's Principle...for now
- arxiv url: http://arxiv.org/abs/2512.02016v1
- Date: Mon, 01 Dec 2025 18:59:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:35.043579
- Title: Objects in Generated Videos Are Slower Than They Appear: Models Suffer Sub-Earth Gravity and Don't Know Galileo's Principle...for now
- Title(参考訳): 生成したビデオのオブジェクトは、それより遅い: 地下重力によるモデルとガリレオの原理を今は知らない...
- Authors: Varun Varma Thozhiyoor, Shivam Tripathi, Venkatesh Babu Radhakrishnan, Anand Bhattad,
- Abstract要約: ビデオジェネレータは、潜在的な世界モデルとしてますます評価されている。
基本法則である重力の表現について検討する。
100個のシングルボールクリップのみに微調整された軽量の低ランクアダプタは、$g_mathrmeff$を1.81,mathrmm/s2$から6.43,mathrmm/s2$に引き上げる(地上重力の65%を占める)。
- 参考スコア(独自算出の注目度): 10.272466104440381
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video generators are increasingly evaluated as potential world models, which requires them to encode and understand physical laws. We investigate their representation of a fundamental law: gravity. Out-of-the-box video generators consistently generate objects falling at an effectively slower acceleration. However, these physical tests are often confounded by ambiguous metric scale. We first investigate if observed physical errors are artifacts of these ambiguities (e.g., incorrect frame rate assumptions). We find that even temporal rescaling cannot correct the high-variance gravity artifacts. To rigorously isolate the underlying physical representation from these confounds, we introduce a unit-free, two-object protocol that tests the timing ratio $t_1^2/t_2^2 = h_1/h_2$, a relationship independent of $g$, focal length, and scale. This relative test reveals violations of Galileo's equivalence principle. We then demonstrate that this physical gap can be partially mitigated with targeted specialization. A lightweight low-rank adaptor fine-tuned on only 100 single-ball clips raises $g_{\mathrm{eff}}$ from $1.81\,\mathrm{m/s^2}$ to $6.43\,\mathrm{m/s^2}$ (reaching $65\%$ of terrestrial gravity). This specialist adaptor also generalizes zero-shot to two-ball drops and inclined planes, offering initial evidence that specific physical laws can be corrected with minimal data.
- Abstract(参考訳): ビデオジェネレータは、物理法則のエンコードと理解を必要とする潜在的な世界モデルとして、ますます評価されている。
基本法則である重力の表現について検討する。
アウト・オブ・ザ・ボックスのビデオジェネレータは、効果的に遅い加速で落下するオブジェクトを一貫して生成する。
しかし、これらの物理テストは、しばしばあいまいな計量スケールによって構成される。
まず、観測された物理誤差がこれらのあいまいさ(例えば、間違ったフレームレートの仮定)のアーチファクトであるかどうかを検討する。
時間的再スケーリングでさえ、高分散重力アーティファクトを補正することはできない。
そこで本研究では,これらのコンファウンドから基礎となる物理表現を厳密に分離するために,時間比$t_1^2/t_2^2 = h_1/h_2$,$g$に依存しない関係,焦点長,スケールを検査する単位自由2オブジェクトプロトコルを導入する。
この相対試験はガリレオの同値原理の違反を明らかにする。
そして、この物理的ギャップを目標とする特殊化によって部分的に緩和できることを実証する。
100個のシングルボールクリップのみに微調整された軽量のローランクアダプタは、$g_{\mathrm{eff}}$を$1.81\,\mathrm{m/s^2}$から$6.43\,\mathrm{m/s^2}$に引き上げる(地上重力の6.5\%の値を得る)。
この特殊アダプタはまた、ゼロショットから2球ドロップと傾斜面を一般化し、特定の物理法則を最小限のデータで修正できるという最初の証拠を提供する。
関連論文リスト
- What about gravity in video generation? Post-Training Newton's Laws with Verifiable Rewards [49.02795965814016]
ビデオ拡散モデルは視覚的に魅力的なクリップを合成することができるが、基本的な物理法則に違反することが多い。
我々は$textttNewtonRewards$を提案し、$textitverible rewards$をベースとした、ビデオ生成のための最初の物理地上学習フレームワークである。
論文 参考訳(メタデータ) (2025-11-29T10:04:50Z) - TRAVL: A Recipe for Making Video-Language Models Better Judges of Physics Implausibility [70.24211591214528]
ビデオ生成モデルは、浮動、テレポート、モーフィングのような直感的な物理法則に違反したシーケンスを生成する。
既存のビデオランゲージモデル(VLM)は、物理違反の特定に苦慮し、時間的および因果的推論における根本的な制限を明らかにしている。
我々は、バランスの取れたトレーニングデータセットと軌道認識型アテンションモジュールを組み合わせた微調整レシピTRAVLを導入し、モーションエンコーディングを改善する。
言語バイアスを除去し,視覚的時間的理解を分離する300本のビデオ(150本実写150本)のベンチマークであるImplausiBenchを提案する。
論文 参考訳(メタデータ) (2025-10-08T21:03:46Z) - Enhancing Physical Plausibility in Video Generation by Reasoning the Implausibility [37.011366226968]
拡散モデルはリアルなビデオを生成することができるが、既存の方法は大規模テキストビデオデータセットから暗黙的に物理的推論を学ぶことに依存している。
本研究では,推論時の身体的可視性を改善するためのトレーニングフリーフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-29T12:32:54Z) - The path towards measuring the gravitational field of proton bunches at accelerators [0.6530047924748278]
LHC貯蔵環の強い超相対論的な陽子ビームは、一般相対性理論をテストする可能性がある。
本項では、この方向の理論研究の現状について概説する。
論文 参考訳(メタデータ) (2025-04-15T07:45:35Z) - How Far is Video Generation from World Model: A Physical Law Perspective [101.24278831609249]
OpenAIのSoraは、物理法則に準拠した世界モデルを開発するためのビデオ生成の可能性を強調している。
しかし、ビデオ生成モデルが人間の先行しない視覚データから純粋にそのような法則を発見する能力に疑問を投げかけることができる。
本研究は,3つの主要なシナリオ – 分布内,分布外,一般化 – について評価する。
論文 参考訳(メタデータ) (2024-11-04T18:53:05Z) - Testing the nonclassicality of gravity with the field of a single
delocalized mass [55.2480439325792]
調和的に閉じ込められたテスト質量に結合した1つの非局在化質量に基づくセットアップを提案する。
本研究では, カシミール・ポルダー力のテーム能力に大きく依存する, 実験の原理的実現可能性について検討する。
論文 参考訳(メタデータ) (2023-07-18T15:40:16Z) - Probing Modified Gravity with Entanglement of Microspheres [2.097217735462665]
近くの2つのメソスコピック量子質量は、修正重力モデルにおいてかなり大きな絡み合いを蓄積していることを示す。
我々の計算には、カシミール・ポルダー力と、地球表面の横にある潮流効果が含まれる。
論文 参考訳(メタデータ) (2023-06-26T15:38:55Z) - Gravitational decoherence of photons [0.0]
我々はAnastopoulosとHuの重力デコヒーレンスモデルを光子に一般化する。
近未来の実験で利用できる長いベースラインを持つ干渉実験は、原則として$Theta$の強い制約につながる。
論文 参考訳(メタデータ) (2020-11-16T20:53:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。