論文の概要: G3T Up! Gravity Aligned Coordinate Frames Simplify Pointmap Processing
- arxiv url: http://arxiv.org/abs/2605.27372v1
- Date: Tue, 26 May 2026 17:59:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.597132
- Title: G3T Up! Gravity Aligned Coordinate Frames Simplify Pointmap Processing
- Title(参考訳): G3T Up! Gravity Aligned Coordinate Framesによるポイントマップ処理の簡易化
- Authors: Bharath Raj Nagoor Kani, Noah Snavely,
- Abstract要約: 実世界の多くのシーンに存在する強い構造的手がかりを生かした、直立した重力整列フレームにおける点マップの予測を提案する。
重力配向3次元データ上に既存のモデルから微調整された重力接地幾何変換器(G3T)を導入する。
G3Tは、直立点マップやカメラから重力へのポーズを含む、高精度な重力認識予測を生成する。
- 参考スコア(独自算出の注目度): 26.768366991555173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern feed-forward 3D reconstruction methods like VGGT predict pixel-aligned pointmaps in camera-centric coordinate frames. However, this choice of coordinate frame is not always optimal. We propose instead to predict pointmaps in upright, gravity-aligned frames that exploit strong structural cues present in many real-world scenes. Unlike camera-centric frames, gravity-aligned frames share a common vertical axis across viewpoints, reducing the rotational degrees of freedom needed to relate pointmaps to one another. To this end, we introduce the Gravity Grounded Geometry Transformer (G3T), fine-tuned from existing models on gravity-aligned 3D data. G3T produces highly accurate gravity-aware predictions, including upright pointmaps and camera-to-gravity poses. We further introduce G3T-Long, a submap-based incremental 3D reconstruction pipeline that leverages the reduced rotational degrees of freedom afforded by upright frames to achieve significantly improved reconstruction accuracy.
- Abstract(参考訳): VGGTのような最新のフィードフォワード3D再構成手法は、カメラ中心の座標フレームにおける画素アラインポイントマップを予測する。
しかし、この座標フレームの選択は必ずしも最適とは限らない。
そこで我々は,実世界の多くのシーンに存在する強い構造的手がかりを利用する,直立した重力整列フレームにおける点マップの予測を提案する。
カメラ中心のフレームとは異なり、重力アライメントフレームは視点を越えて共通の垂直軸を共有し、ポイントマップを相互に関連付けるのに必要な自由度を減少させる。
この目的のために,重力配向3次元データ上に既存のモデルから微調整された重力接地幾何変換器(G3T)を導入する。
G3Tは、直立点マップやカメラから重力へのポーズを含む、高精度な重力認識予測を生成する。
さらにG3T-Longは,直立フレームで得られる自由度を低減し,再構成精度を大幅に向上させるサブマップベースのインクリメンタル3次元再構成パイプラインである。
関連論文リスト
- World Reconstruction From Inconsistent Views [54.12773637505746]
ビデオ拡散モデルは多様な世界を生成するが、個々のフレームは出力シーケンス全体の3D一貫性を欠いていることが多い。
ビデオフレームをグローバルに一貫性のある座標フレームに厳密に整列させることにより、これらの不整合を処理する新しい手法を提案する。
我々は,我々の3Dシーンがベースラインよりも高品質であることを示し,映像モデルを効果的に3D一貫性のあるワールドジェネレータにする。
論文 参考訳(メタデータ) (2026-03-17T16:18:08Z) - TrajVG: 3D Trajectory-Coupled Visual Geometry Learning [34.47385438436523]
TrajVGは、クロスフレームな3D対応を明示する再構築フレームワークである。
擬似2次元トラックのみを用いて,同じ結合制約を自己教師対象に再構成する。
3Dトラッキング、ポーズ推定、ポイントマップ再構成、ビデオ深度による実験は、TrajVGが現在のフィードフォワードのパフォーマンスベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2026-02-04T11:13:55Z) - TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - St4RTrack: Simultaneous 4D Reconstruction and Tracking in the World [106.91539872943864]
St4RTrackは、RGB入力から世界座標フレーム内の動的ビデオコンテンツを同時に再構成し、追跡するフレームワークである。
静的および動的シーン幾何学の両方をキャプチャして、同じ世界において、同時に両方のポイントマップを予測する。
統合されたデータ駆動フレームワークの有効性と効率を実証し、世界フレームの再構築と追跡のための新しい広範囲なベンチマークを構築します。
論文 参考訳(メタデータ) (2025-04-17T17:55:58Z) - Gravity-aligned Rotation Averaging with Circular Regression [53.81374943525774]
我々は,重力方向をグローバルパイプラインの回転平均位相に統合する原理的アプローチを導入する。
4つの大規模データセットで最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-10-16T17:37:43Z) - E-Graph: Minimal Solution for Rigid Rotation with Extensibility Graphs [61.552125054227595]
重なり合う領域を持たない2つの画像間の相対的な回転推定を解くために,新しい最小解を提案する。
E-Graphに基づいて、回転推定問題はより単純でエレガントになる。
回転推定戦略を6-DoFカメラのポーズと高密度3Dメッシュモデルを得る完全カメラ追跡マッピングシステムに組み込む。
論文 参考訳(メタデータ) (2022-07-20T16:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。