論文の概要: MoGe-2: Accurate Monocular Geometry with Metric Scale and Sharp Details
- arxiv url: http://arxiv.org/abs/2507.02546v1
- Date: Thu, 03 Jul 2025 11:40:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.186129
- Title: MoGe-2: Accurate Monocular Geometry with Metric Scale and Sharp Details
- Title(参考訳): MoGe-2: メトリスケールとシャープ細部を有する高精度な単色幾何学
- Authors: Ruicheng Wang, Sicheng Xu, Yue Dong, Yu Deng, Jianfeng Xiang, Zelong Lv, Guangzhong Sun, Xin Tong, Jiaolong Yang,
- Abstract要約: MoGe-2は高度な開領域幾何推定モデルである。
単一の画像からシーンのメトリックスケール3Dポイントマップを復元する。
- 参考スコア(独自算出の注目度): 26.5687684583391
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose MoGe-2, an advanced open-domain geometry estimation model that recovers a metric scale 3D point map of a scene from a single image. Our method builds upon the recent monocular geometry estimation approach, MoGe, which predicts affine-invariant point maps with unknown scales. We explore effective strategies to extend MoGe for metric geometry prediction without compromising the relative geometry accuracy provided by the affine-invariant point representation. Additionally, we discover that noise and errors in real data diminish fine-grained detail in the predicted geometry. We address this by developing a unified data refinement approach that filters and completes real data from different sources using sharp synthetic labels, significantly enhancing the granularity of the reconstructed geometry while maintaining the overall accuracy. We train our model on a large corpus of mixed datasets and conducted comprehensive evaluations, demonstrating its superior performance in achieving accurate relative geometry, precise metric scale, and fine-grained detail recovery -- capabilities that no previous methods have simultaneously achieved.
- Abstract(参考訳): 画像からシーンの3次元ポイントマップを復元する,高度なオープンドメイン幾何推定モデルであるMoGe-2を提案する。
本手法は,アフィン不変点マップを未知のスケールで予測する,最近の単分子幾何推定手法であるMoGeに基づいて構築する。
我々は,アフィン不変点表現によって得られる相対幾何学的幾何精度を損なうことなく,幾何予測のためにMoGeを拡張する効果的な戦略を探求する。
さらに,実データにおけるノイズや誤差が予測幾何の微細な詳細さを減少させることがわかった。
そこで我々は, シャープな合成ラベルを用いて, 異なるソースから実データをフィルタリングし, 完成する統一データ精錬手法を開発し, 全体の精度を維持しながら, 再構成された幾何の粒度を著しく向上させることにより, この問題に対処する。
我々は、混合データセットの大規模なコーパスでモデルをトレーニングし、包括的な評価を行い、正確な相対幾何学、正確なメートル法スケール、きめ細かい詳細回復を達成する上で、その優れた性能を示す。
関連論文リスト
- Follow the Energy, Find the Path: Riemannian Metrics from Energy-Based Models [35.5088111343308]
本稿では,事前学習したエネルギーベースモデルから直接リーマン計量を導出する手法を提案する。
これらの測度は空間的に異なる距離を定義し、測地学の計算を可能にする。
EBM由来のメトリクスは、確立されたベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2025-05-23T12:18:08Z) - MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision [23.12838070960566]
モノクラーオープンドメイン画像から3次元形状を復元する強力なモデルであるMoGeを提案する。
一つの画像が与えられた場合、アフィン不変表現でキャプチャされたシーンの3Dポイントマップを直接予測する。
本稿では,高品質な幾何学を学習する上で,モデルに有効性を与える新しいグローバルおよびローカルな幾何学監督手法を提案する。
論文 参考訳(メタデータ) (2024-10-24T19:29:02Z) - Score-based Pullback Riemannian Geometry: Extracting the Data Manifold Geometry using Anisotropic Flows [10.649159213723106]
本稿では,データ駆動型リーマン幾何学のフレームワークを提案する。
提案手法は,データサポートを通した高品質な測地線を生成する。
これは、データ多様体の完全な幾何学を抽出する最初のスケーラブルなフレームワークである。
論文 参考訳(メタデータ) (2024-10-02T18:52:12Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Trim 3D Gaussian Splatting for Accurate Geometry Representation [72.00970038074493]
画像から正確な3次元形状を復元するためにTrim 3D Gaussian Splatting (TrimGS)を導入する。
実験および理論的解析により、比較的小さなガウススケールが複雑な詳細を表現・最適化する非無視因子であることが判明した。
元の3DGSと最先端の2DGSと組み合わせると、TrimGSは一貫してより正確な幾何学と高い知覚品質が得られる。
論文 参考訳(メタデータ) (2024-06-11T17:34:46Z) - SAGS: Structure-Aware 3D Gaussian Splatting [53.6730827668389]
本研究では,シーンの形状を暗黙的に符号化する構造認識型ガウス散乱法(SAGS)を提案する。
SAGSは、最先端のレンダリング性能と、ベンチマークノベルビュー合成データセットのストレージ要件の削減を反映している。
論文 参考訳(メタデータ) (2024-04-29T23:26:30Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。