Fugu-MT 論文翻訳(概要): Measuring 3D Spatial Geometric Consistency in Dynamic Generated Videos

論文の概要: Measuring 3D Spatial Geometric Consistency in Dynamic Generated Videos

arxiv url: http://arxiv.org/abs/2603.19048v1
Date: Thu, 19 Mar 2026 15:44:39 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-20 17:19:06.238056
Title: Measuring 3D Spatial Geometric Consistency in Dynamic Generated Videos
Title（参考訳）: ダイナミック・ジェネレーション映像における3次元空間幾何学的一貫性の測定
Authors: Weijia Dou, Wenzhao Zheng, Weiliang Chen, Yu Zheng, Jie Zhou, Jiwen Lu,
Abstract要約: ビデオにおける3D textbfSpatial textbfGeometric textbfConsistencyを評価するためのメトリクスであるSGCを紹介する。 SGCは幾何的不整合を頑健に定量化し、既存のメトリクスで欠落した臨界故障を効果的に特定する。
参考スコア（独自算出の注目度）: 67.7364297817535
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent generative models can produce high-fidelity videos, yet they often exhibit 3D spatial geometric inconsistencies. Existing evaluation methods fail to accurately characterize these inconsistencies: fidelity-centric metrics like FVD are insensitive to geometric distortions, while consistency-focused benchmarks often penalize valid foreground dynamics. To address this gap, we introduce SGC, a metric for evaluating 3D \textbf{S}patial \textbf{G}eometric \textbf{C}onsistency in dynamically generated videos. We quantify geometric consistency by measuring the divergence among multiple camera poses estimated from distinct local regions. Our approach first separates static from dynamic regions, then partitions the static background into spatially coherent sub-regions. We predict depth for each pixel, estimate a local camera pose for each subregion, and compute the divergence among these poses to quantify geometric consistency. Experiments on real and generative videos demonstrate that SGC robustly quantifies geometric inconsistencies, effectively identifying critical failures missed by existing metrics.
Abstract（参考訳）: 最近の生成モデルは高忠実度ビデオを生成することができるが、しばしば3次元空間的不整合を示す。 FVDのような忠実度中心のメトリクスは幾何学的歪みに敏感であり、整合性中心のベンチマークは有効な前景力学をペナルティ化する。このギャップに対処するために、動的に生成されたビデオにおける3D \textbf{S}patial \textbf{G}eometric \textbf{C}onsistencyを評価するためのメトリクスであるSGCを紹介する。我々は、異なる局所領域から推定される複数のカメラポーズ間のばらつきを測定することで、幾何的一貫性を定量化する。我々のアプローチは、まず静的な領域と動的な領域を分離し、次いで静的な背景を空間的に一貫性のあるサブリージョンに分割する。我々は各画素の深度を予測し、各サブリージョンのローカルカメラのポーズを推定し、これらのポーズ間のばらつきを計算し、幾何的一貫性を定量化する。実ビデオと生成ビデオの実験では、SGCが幾何的不整合を頑健に定量化し、既存のメトリクスで欠落した致命的な失敗を効果的に特定することを示した。

関連論文リスト

Geometry OR Tracker: Universal Geometric Operating Room Tracking [61.399734016038614]
手術室(OR)では、世界規模のマルチビュー3Dトラッキングは、外科医の行動認識のような下流のアプリケーションをサポートする。カメラのキャリブレーションとRGB-Dの登録は常に信頼性が低く、幾何学的不整合が生じる。我々は、不正確なキャリブレーションをスケール一貫性と幾何学的に整合したカメラ設定に修正する2段階パイプラインであるGeometry OR Trackerを紹介する。
論文参考訳（メタデータ） (2026-02-28T09:21:21Z)
Geometry-Aware Rotary Position Embedding for Consistent Video World Model [48.914346802616414]
ViewRopeは、ビデオトランスフォーマーの自己アテンション層に直接カメラの方向を注入するジオメトリ対応のエンコーディングである。 Geometry-Aware Frame-Sparse Attentionは、これらの幾何学的手がかりを利用して、関連する歴史的なフレームに選択的に参加する。この結果から,ViewRopeは長期的整合性を大幅に向上し,計算コストを低減できることがわかった。
論文参考訳（メタデータ） (2026-02-08T08:01:16Z)
GeCo: A Differentiable Geometric Consistency Metric for Video Generation [61.28264035357065]
静的なシーンにおける幾何学的変形と閉塞不整合を共同検出するための幾何学的グラウンドメトリックであるGeCoを紹介する。残留した動きと深さの先行を融合させることで、GeCoはこれらのアーティファクトを明らかにする解釈可能な高密度な一貫性マップを生成する。我々は、GeCoを使用して、最新のビデオ生成モデルを体系的にベンチマークし、共通の障害モードを明らかにし、さらに、ビデオ生成時の変形アーチファクトを低減するために、トレーニング不要な損失ガイダンスとして使用します。
論文参考訳（メタデータ） (2025-12-25T03:28:28Z)
GeoVideo: Introducing Geometric Regularization into Video Generation Model [46.38507581500745]
フレームごとの深度予測による潜時拡散モデルの拡大により,ビデオ生成に幾何正則化損失を導入する。本手法は, 外観生成と3次元構造モデリングのギャップを埋めることにより, 構造的コヒーレンス・時間的形状, 整合性, 物理的妥当性が向上する。
論文参考訳（メタデータ） (2025-12-03T05:11:57Z)
Epipolar Geometry Improves Video Generation Models [73.44978239787501]
3D一貫性のあるビデオ生成は、生成および再構成タスクにおける多くの下流アプリケーションに大きな影響を与える可能性がある。エピポーラ幾何学的制約が現代のビデオ拡散モデルをどのように改善するかを考察する。データ駆動型ディープラーニングを古典的幾何学的コンピュータビジョンでブリッジすることで、空間的に一貫したビデオを生成する実用的な方法を提案する。
論文参考訳（メタデータ） (2025-10-24T16:21:37Z)
GeometryCrafter: Consistent Geometry Estimation for Open-world Videos with Diffusion Priors [47.21120442961684]
オープンワールドビデオから時間的コヒーレンスで高忠実度点マップシーケンスを復元する新しいフレームワークであるGeometryCrafterを提案する。 GeometryCrafterは最先端の3D精度、時間的一貫性、一般化能力を実現する。
論文参考訳（メタデータ） (2025-04-01T17:58:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。