論文の概要: TrueCity: Real and Simulated Urban Data for Cross-Domain 3D Scene Understanding
- arxiv url: http://arxiv.org/abs/2511.07007v1
- Date: Mon, 10 Nov 2025 11:57:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.226025
- Title: TrueCity: Real and Simulated Urban Data for Cross-Domain 3D Scene Understanding
- Title(参考訳): TrueCity: クロスドメインな3Dシーン理解のための実・模擬都市データ
- Authors: Duc Nguyen, Yan-Ling Lai, Qilin Zhang, Prabin Gyawali, Benedikt Schwab, Olaf Wysocki, Thomas H. Kolbe,
- Abstract要約: 3Dのセマンティックなシーン理解は、3Dコンピュータビジョンコミュニティにおいて長年の課題である。
我々は,cm精度のアノテート実世界の点群,セマンティック3次元都市モデル,および同じ都市を表すアノテート模擬点群を用いた最初の都市セマンティックセマンティックセマンティクスベンチマークであるTrueCityを紹介する。
- 参考スコア(独自算出の注目度): 12.573182815543978
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D semantic scene understanding remains a long-standing challenge in the 3D computer vision community. One of the key issues pertains to limited real-world annotated data to facilitate generalizable models. The common practice to tackle this issue is to simulate new data. Although synthetic datasets offer scalability and perfect labels, their designer-crafted scenes fail to capture real-world complexity and sensor noise, resulting in a synthetic-to-real domain gap. Moreover, no benchmark provides synchronized real and simulated point clouds for segmentation-oriented domain shift analysis. We introduce TrueCity, the first urban semantic segmentation benchmark with cm-accurate annotated real-world point clouds, semantic 3D city models, and annotated simulated point clouds representing the same city. TrueCity proposes segmentation classes aligned with international 3D city modeling standards, enabling consistent evaluation of synthetic-to-real gap. Our extensive experiments on common baselines quantify domain shift and highlight strategies for exploiting synthetic data to enhance real-world 3D scene understanding. We are convinced that the TrueCity dataset will foster further development of sim-to-real gap quantification and enable generalizable data-driven models. The data, code, and 3D models are available online: https://tum-gis.github.io/TrueCity/
- Abstract(参考訳): 3Dのセマンティックなシーン理解は、3Dコンピュータビジョンコミュニティにおいて長年の課題である。
主要な問題の1つは、一般化可能なモデルを促進するために、限られた実世界のアノテートデータに関するものである。
この問題に対処する一般的な方法は、新しいデータをシミュレートすることだ。
合成データセットはスケーラビリティと完璧なラベルを提供するが、デザイナが作ったシーンは現実の複雑さとセンサーノイズを捉えることができず、結果として合成から実際のドメインギャップが生じる。
さらに、セグメンテーション指向のドメインシフト分析のために、同期された実およびシミュレートされた点雲を提供するベンチマークは存在しない。
我々は,cm精度のアノテート実世界の点群,セマンティック3次元都市モデル,および同じ都市を表すアノテート模擬点群を用いた最初の都市セマンティックセマンティックセマンティクスベンチマークであるTrueCityを紹介する。
TrueCityは、国際的な3D都市モデリング標準に沿ったセグメンテーションクラスを提案し、合成と現実のギャップを一貫した評価を可能にした。
共通ベースラインに関する広範な実験は、ドメインシフトの定量化と、実世界の3Dシーン理解を強化するために合成データを活用するための戦略の強調を目的としている。
TrueCityデータセットは、sim-to-realギャップ定量化のさらなる発展を促進し、一般化可能なデータ駆動モデルを可能にすると確信している。
データ、コード、および3Dモデルはオンラインで利用可能である。
関連論文リスト
- UrbanTwin: Synthetic LiDAR Datasets (LUMPI, V2X-Real-IC, and TUMTraf-I) [3.1508266388327324]
UrbanTwinデータセットは、3つの公開ロードサイドライダーデータセットの高忠実で現実的なレプリカである。
各UrbanTwinデータセットには、パブリックデータセットの1つに対応する10Kフレームが含まれている。
論文 参考訳(メタデータ) (2025-09-08T15:06:02Z) - Stable-Sim2Real: Exploring Simulation of Real-Captured 3D Data with Two-Stage Depth Diffusion [16.720863475636328]
3Dデータシミュレーションは、シミュレーションされた3Dデータと実際の3Dデータのギャップを埋めることを目的としている。
大部分の3Dデータシミュレーション手法は、事前に定義された物理的前提を注入するが、実際のデータの完全な複雑さを捉えるのに苦労する。
この研究は、新しい2段階の深さ拡散モデルに基づいて、Stable-Sim2Realと呼ばれる新しい解経路を探索する。
論文 参考訳(メタデータ) (2025-07-31T12:08:16Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Towards Generating Realistic 3D Semantic Training Data for Autonomous Driving [27.088907562842902]
自律運転では、3Dセマンティックセグメンテーションが安全なナビゲーションを可能にする重要な役割を果たす。
3Dデータの収集と注釈付けの複雑さは、この開発のボトルネックである。
本稿では,3次元のセマンティック・シーン・スケールのデータを投影モデルやデカップリングモデルに頼らずに生成する手法を提案する。
論文 参考訳(メタデータ) (2025-03-27T12:41:42Z) - SimVS: Simulating World Inconsistencies for Robust View Synthesis [102.83898965828621]
本稿では、生成ビデオモデルを利用して、キャプチャ中に起こりうる世界の不整合をシミュレートする手法を提案する。
我々の世界シミュレーション戦略は、現実のシーンのバリエーションを扱う上で、従来の拡張手法よりも大幅に優れていることを実証する。
論文 参考訳(メタデータ) (2024-12-10T17:35:12Z) - BelHouse3D: A Benchmark Dataset for Assessing Occlusion Robustness in 3D Point Cloud Semantic Segmentation [2.446672595462589]
本稿では,3次元屋内シーンセマンティックセマンティックセグメンテーション用に設計された,新たな合成点クラウドデータセットであるBelHouse3Dデータセットを紹介する。
このデータセットは、ベルギーの32軒の家の実世界の参照を使って構築されており、合成データが実世界の状況と密接に一致していることを保証する。
論文 参考訳(メタデータ) (2024-11-20T12:09:43Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions [68.28684509445529]
HandBoosterは、データの多様性を向上し、3Dハンド・ミーシュ・リコンストラクションのパフォーマンスを向上する新しいアプローチである。
まず,多様な手やポーズ,ビュー,背景を持つリアルな画像を生成するために,拡散モデルを誘導する多目的コンテンツ認識条件を構築した。
そこで我々は,我々の類似性を考慮した分布サンプリング戦略に基づく新しい条件作成手法を設計し,トレーニングセットとは異なる,斬新で現実的なインタラクションのポーズを意図的に見つける。
論文 参考訳(メタデータ) (2024-03-27T13:56:08Z) - Towards 3D Scene Understanding by Referring Synthetic Models [65.74211112607315]
メソッドは通常、実際のシーンスキャンにおける過剰なアノテーションを緩和する。
合成モデルは、合成特徴の実際のシーンカテゴリを、統一された特徴空間にどのように依存するかを考察する。
実験の結果,ScanNet S3DISデータセットの平均mAPは46.08%,学習データセットは55.49%であった。
論文 参考訳(メタデータ) (2022-03-20T13:06:15Z) - SensatUrban: Learning Semantics from Urban-Scale Photogrammetric Point
Clouds [52.624157840253204]
センサットウルバン(SensatUrban)は、イギリスの3都市から収集された7.6km2の30億点近くからなる、都市規模のUAV測光点クラウドデータセットである。
データセットの各ポイントは、粒度の細かいセマンティックアノテーションでラベル付けされ、その結果、既存の最大のフォトグラムポイントクラウドデータセットの3倍の大きさのデータセットが生成される。
論文 参考訳(メタデータ) (2022-01-12T14:48:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。