論文の概要: Long-tail Internet photo reconstruction
- arxiv url: http://arxiv.org/abs/2604.22714v1
- Date: Fri, 24 Apr 2026 16:54:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.538013
- Title: Long-tail Internet photo reconstruction
- Title(参考訳): ロングテールインターネット写真再構成
- Authors: Yuan Li, Yuanbo Xiangli, Hadar Averbuch-Elor, Noah Snavely, Ruojin Cai,
- Abstract要約: MegaDepth-Xはクリーンで密度の高い3次元再構成の大規模なデータセットであり、ロングテールシーンにおけるカメラ分布を模倣するトレーニング画像の集合をサンプリングする戦略も導入する。
これらのコンポーネントで微調整された3D基盤モデルは、極端に広い範囲で堅牢な再構築を実現するとともに、標準の高密度な3Dベンチマークデータセットへの一般化を保ちながら、対称的かつ反復的なシーンでのより信頼性の高い再構築を可能にする。
- 参考スコア(独自算出の注目度): 45.07676022067821
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Internet photo collections exhibit an extremely long-tailed distribution: a few famous landmarks are densely photographed and easily reconstructed in 3D, while most real-world sites are represented with sparse, noisy, uneven imagery beyond the capabilities of both classical and learned 3D methods. We believe that tackling this long-tail regime represents one of the next frontiers for 3D foundation models. Although reliable ground-truth 3D supervision from sparse scenes is challenging to acquire, we observe that it can be effectively simulated by sampling sparse subsets from well-reconstructed Internet landmarks. To this end, we introduce MegaDepth-X, a large dataset of 3D reconstructions with clean, dense depth, together with a strategy for sampling sets of training images that mimic camera distributions in long-tail scenes. Finetuning 3D foundation models with these components yields robust reconstructions under extreme sparsity, and also enables more reliable reconstruction in symmetric and repetitive scenes, while preserving generalization to standard, dense 3D benchmark datasets.
- Abstract(参考訳): 有名なランドマークが密集して3Dで簡単に再構築される一方、現実世界のほとんどのサイトは、古典的および学習された3D手法の能力を超えた、まばらでノイズの多い、不均一なイメージで表現されている。
この長い尾の仕組みは、3Dファンデーションモデルの次のフロンティアの1つだと考えています。
スパースシーンからの信頼性の高い地上3D監視は取得が難しいが、よく再構成されたインターネットランドマークからスパースサブセットをサンプリングすることにより、効果的にシミュレートできることが観察された。
この目的のために,メガデプスX(MegaDepth-X)という3次元再構成の大規模なデータセットと,ロングテールシーンにおけるカメラ分布を模倣したトレーニング画像の集合をサンプリングする戦略を紹介する。
これらのコンポーネントで微調整された3D基盤モデルは、極端に広い範囲で堅牢な再構築を実現するとともに、標準の高密度な3Dベンチマークデータセットへの一般化を保ちながら、対称的かつ反復的なシーンでのより信頼性の高い再構築を可能にする。
関連論文リスト
- Emergent Extreme-View Geometry in 3D Foundation Models [26.53730031068199]
3Dファウンデーションモデル(3DFM)は、最近3Dビジョンを変換し、画像から直接深度、ポーズ、ポイントマップの合同予測を可能にした。
内部表現について検討し、3DFMは、そのような条件下では訓練されないにもかかわらず、極視的幾何学の創発的な理解を示すことを発見した。
バックボーンバイアス項の小さな部分のみを調整し,デコーダの頭部を凍結させて内部の3次元表現を改良する軽量アライメント方式を提案する。
既存の3DFMでは見えない新しいインターネットシーンのベンチマークであるMegaUnSceneにコントリビュートする。
論文 参考訳(メタデータ) (2025-11-27T18:40:03Z) - An Evaluation of DUSt3R/MASt3R/VGGT 3D Reconstruction on Photogrammetric Aerial Blocks [17.58704237530163]
3Dコンピュータビジョンアルゴリズムは、スパースで非順序のイメージセットの処理に引き続き進歩している。
近年,3次元再構成のための基礎モデルが注目されている。
本稿では,DUSt3R/MASt3R/VGGTモデルを用いて,ポーズ推定と高密度3次元再構成を行う。
論文 参考訳(メタデータ) (2025-07-20T03:09:04Z) - HORT: Monocular Hand-held Objects Reconstruction with Transformers [61.36376511119355]
モノクロ画像から手持ちの物体を3Dで再構成することは、コンピュータビジョンにおいて重要な課題である。
ハンドヘルドオブジェクトの高密度な3次元点群を効率的に再構成するトランスフォーマーモデルを提案する。
提案手法は,高速な推測速度で最先端の精度を達成し,画像の幅を最適化する。
論文 参考訳(メタデータ) (2025-03-27T09:45:09Z) - MUSt3R: Multi-view Network for Stereo 3D Reconstruction [11.61182864709518]
本稿では,DUSt3Rのペアから複数のビューへの拡張を提案する。
計算複雑性を低減できる多層メモリ機構でモデルを拡張します。
このフレームワークは、オフラインとオンラインの両方で3D再構成を実行するように設計されているため、SfMとビジュアルSLAMシナリオにシームレスに適用できる。
論文 参考訳(メタデータ) (2025-03-03T15:36:07Z) - Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。
提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-03-21T17:59:59Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Monocular 3D Object Reconstruction with GAN Inversion [122.96094885939146]
MeshInversionはテクスチャ化された3Dメッシュの再構築を改善するための新しいフレームワークである。
これは、3Dテクスチャメッシュ合成のために事前訓練された3D GANの生成前を利用する。
本フレームワークは,観察部と観察部の両方で一貫した形状とテクスチャを有する忠実な3次元再構成を実現する。
論文 参考訳(メタデータ) (2022-07-20T17:47:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。