論文の概要: TerraSky3D: Multi-View Reconstructions of European Landmarks in 4K
- arxiv url: http://arxiv.org/abs/2603.28287v1
- Date: Mon, 30 Mar 2026 11:08:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.350421
- Title: TerraSky3D: Multi-View Reconstructions of European Landmarks in 4K
- Title(参考訳): TerraSky3D:4Kで欧州のランドマークをマルチビューで再現
- Authors: Mattia D'Urso, Yuxi Hu, Christian Sormann, Mattia Rossi, Friedrich Fraundorfer,
- Abstract要約: 既存の3Dデータセットは解像度が低いか、少数のシーンに制限されるか、インターネットから取得したさまざまな品質の画像に基づいて、特定のキャプチャシナリオに制限される。
この適切な3Dデータセットが欠如していることに感銘を受けて、我々は5万枚の画像を150の地上、空中、混合シーンに分割した高解像度の大規模3D再構成データセットTerraSky3Dを捉えた。
- 参考スコア(独自算出の注目度): 12.214651317714939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the growing need for data of more and more sophisticated 3D reconstruction pipelines, we can still observe a scarcity of suitable public datasets. Existing 3D datasets are either low resolution, limited to a small amount of scenes, based on images of varying quality because retrieved from the internet, or limited to specific capturing scenarios. Motivated by this lack of suitable 3D datasets, we captured TerraSky3D, a high-resolution large-scale 3D reconstruction dataset comprising 50,000 images divided into 150 ground, aerial, and mixed scenes. The dataset focuses on European landmarks and comes with curated calibration data, camera poses, and depth maps. TerraSky3D tries to answer the need for challenging dataset that can be used to train and evaluate 3D reconstruction-related pipelines.
- Abstract(参考訳): より高度な3D再構築パイプラインのデータの必要性はますます高まっているが、適切なパブリックデータセットの不足を観察できる。
既存の3Dデータセットは解像度が低いか、少数のシーンに制限されるか、インターネットから取得したさまざまな品質の画像に基づいて、特定のキャプチャシナリオに制限される。
この適切な3Dデータセットが欠如していることに感銘を受けて、我々は5万枚の画像を150の地上、空中、混合シーンに分割した高解像度の大規模3D再構成データセットTerraSky3Dを捉えた。
このデータセットはヨーロッパのランドマークに焦点を当てており、キュレーションされたキャリブレーションデータ、カメラポーズ、深度マップを備えている。
TerraSky3Dは、3D再構成関連パイプラインのトレーニングと評価に使用できる、挑戦的なデータセットの必要性に答えようとしている。
関連論文リスト
- Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.64738535860351]
単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。
本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。
画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文 参考訳(メタデータ) (2025-07-24T14:53:26Z) - CULTURE3D: A Large-Scale and Diverse Dataset of Cultural Landmarks and Terrains for Gaussian-Based Scene Rendering [16.614203937535205]
現在の最先端の3D再構築モデルは、大規模な屋外シーンを構築する際の限界に直面している。
本稿では,41,006個のドローンによる高解像度空中画像からなる100億点の細粒度データセットを提案する。
既存のデータセットと比較すると、我々は非常に大きなスケールと詳細を提供しており、きめ細かい3Dアプリケーションに特化しています。
論文 参考訳(メタデータ) (2025-01-12T20:36:39Z) - Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos [76.07894127235058]
本稿では,インターネットの立体視,広角ビデオから高品質な4D再構成をマイニングするシステムを提案する。
本研究では,この手法を用いて世界整合型擬似3次元点雲の形で大規模データを生成する。
DUSt3Rの変種をトレーニングし、実世界の画像対から構造と3次元運動を予測することで、このデータの有用性を実証する。
論文 参考訳(メタデータ) (2024-12-12T18:59:54Z) - Den-SOFT: Dense Space-Oriented Light Field DataseT for 6-DOF Immersive Experience [28.651514326042648]
我々は,移動式マルチカメラ大空間高密度光場キャプチャシステムを構築した。
本研究の目的は,一般的な3次元シーン再構築アルゴリズムの開発に貢献することである。
収集されたデータセットは、既存のデータセットよりもはるかに密度が高い。
論文 参考訳(メタデータ) (2024-03-15T02:39:44Z) - Cross3DVG: Cross-Dataset 3D Visual Grounding on Different RGB-D Scans [6.936271803454143]
3Dシーンにおけるクロスデータセット視覚的グラウンド化のための新しいタスク(Cross3DVG)を提案する。
大規模な3DビジュアルグラウンドデータセットであるROOReferを作成しました。
3RScanの1,380の屋内RGB-Dスキャンで、63万以上の3Dオブジェクトが記述されている。
論文 参考訳(メタデータ) (2023-05-23T09:52:49Z) - 3D Data Augmentation for Driving Scenes on Camera [50.41413053812315]
本稿では,Drive-3DAugと呼ばれる3次元データ拡張手法を提案する。
まずNeural Radiance Field(NeRF)を用いて,背景および前景の3次元モデルの再構成を行う。
そして、予め定義された背景の有効領域に適応した位置と向きの3Dオブジェクトを配置することにより、拡張駆動シーンを得ることができる。
論文 参考訳(メタデータ) (2023-03-18T05:51:05Z) - MobileBrick: Building LEGO for 3D Reconstruction on Mobile Devices [78.20154723650333]
高品質な3次元地下構造は3次元物体再構成評価に不可欠である。
本稿では,モバイルデバイスを用いた新しいマルチビューRGBDデータセットを提案する。
我々は,ハイエンド3Dスキャナーを使わずに,精密な3次元地下構造が得られる。
論文 参考訳(メタデータ) (2023-03-03T14:02:50Z) - Habitat-Matterport 3D Dataset (HM3D): 1000 Large-scale 3D Environments
for Embodied AI [55.475530452838946]
HM3D は 112.5k m2 の空間を持ち、MP3D や Gibson のような他のビルスケールデータセットよりも1.4-3.7倍大きい。
HM3Dで撮影された画像は、実際のカメラで撮影した画像よりも20~85%高い視力を持つ。
HM3DトレーニングされたPointNavエージェントは、Gibson-testデータセット上で100%のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-09-16T22:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。