論文の概要: WildScenes: A Benchmark for 2D and 3D Semantic Segmentation in
Large-scale Natural Environments
- arxiv url: http://arxiv.org/abs/2312.15364v1
- Date: Sat, 23 Dec 2023 22:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 18:30:01.797892
- Title: WildScenes: A Benchmark for 2D and 3D Semantic Segmentation in
Large-scale Natural Environments
- Title(参考訳): WildScenes: 大規模自然環境における2次元および3次元セマンティックセグメンテーションのベンチマーク
- Authors: Kavisha Vidanapathirana, Joshua Knights, Stephen Hausler, Mark Cox,
Milad Ramezani, Jason Jooste, Ethan Griffiths, Shaheer Mohamed, Sridha
Sridharan, Clinton Fookes and Peyman Moghadam
- Abstract要約: WildScenesは、自然環境における複数の大規模データセットからなる、バイモーダルなベンチマークデータセットである。
データは軌道中心であり、正確なローカライゼーションとグローバルに整列した点雲がある。
本稿では,2次元および3次元セマンティックセマンティックセグメンテーションのベンチマークを導入し,近年のディープラーニング技術の評価を行う。
- 参考スコア(独自算出の注目度): 34.24004079703609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent progress in semantic scene understanding has primarily been enabled by
the availability of semantically annotated bi-modal (camera and lidar) datasets
in urban environments. However, such annotated datasets are also needed for
natural, unstructured environments to enable semantic perception for
applications, including conservation, search and rescue, environment
monitoring, and agricultural automation. Therefore, we introduce WildScenes, a
bi-modal benchmark dataset consisting of multiple large-scale traversals in
natural environments, including semantic annotations in high-resolution 2D
images and dense 3D lidar point clouds, and accurate 6-DoF pose information.
The data is (1) trajectory-centric with accurate localization and globally
aligned point clouds, (2) calibrated and synchronized to support bi-modal
inference, and (3) containing different natural environments over 6 months to
support research on domain adaptation. Our 3D semantic labels are obtained via
an efficient automated process that transfers the human-annotated 2D labels
from multiple views into 3D point clouds, thus circumventing the need for
expensive and time-consuming human annotation in 3D. We introduce benchmarks on
2D and 3D semantic segmentation and evaluate a variety of recent deep-learning
techniques to demonstrate the challenges in semantic segmentation in natural
environments. We propose train-val-test splits for standard benchmarks as well
as domain adaptation benchmarks and utilize an automated split generation
technique to ensure the balance of class label distributions. The data,
evaluation scripts and pretrained models will be released upon acceptance at
https://csiro-robotics.github.io/WildScenes.
- Abstract(参考訳): セマンティックシーン理解の最近の進歩は、主に都市環境におけるセマンティックアノテートされたバイモーダル(カメラとライダー)データセットの利用によって実現されている。
しかし、このような注釈付きデータセットは自然で非構造的な環境でも必要であり、保護、探索、救助、環境モニタリング、農業の自動化など、応用のセマンティックな認識を可能にする。
そこで,WildScenesは,高解像度2次元画像のセマンティックアノテーションや高密度3次元ライダー点雲,正確な6-DoFポーズ情報など,自然環境における大規模トラバーサルで構成されたバイモーダルなベンチマークデータセットである。
データは,(1)正確な測地とグローバルに整列した点雲の軌道中心,(2)バイモーダル推論をサポートするようにキャリブレーションと同期,(3)6か月間の異なる自然環境を含む領域適応の研究である。
我々の3Dセマンティックラベルは、人間の注釈付き2Dラベルを複数のビューから3Dポイントクラウドに転送する効率的な自動化プロセスによって得られる。
自然環境におけるセマンティックセマンティックセグメンテーションの課題を実証するために,2次元および3次元セマンティックセグメンテーションのベンチマークを導入し,最近の深層学習手法の評価を行った。
本稿では,標準ベンチマークとドメイン適応ベンチマークのトレイン・ヴァル・スプリットを提案し,クラスラベル分布のバランスを確保するために自動分割生成手法を用いる。
データ、評価スクリプト、事前訓練されたモデルはhttps://csiro-robotics.github.io/WildScenesで受け入れられる。
関連論文リスト
- Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.448520056844885]
室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文 参考訳(メタデータ) (2024-06-17T08:18:41Z) - ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance
Fields [73.97131748433212]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。
我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。
トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文 参考訳(メタデータ) (2023-11-18T21:58:28Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - 3D-PL: Domain Adaptive Depth Estimation with 3D-aware Pseudo-Labeling [37.315964084413174]
我々は,実際のデータから信頼された疑似基底真理を生成して,直接の監視を行うドメイン適応フレームワークを開発する。
具体的には,(1)画像が同一内容の異なるスタイルのときの深度予測の一貫性を計測し,(2)3次元空間における深度値の完備化を学習するポイントクラウドコンプリートネットワークを介して,擬似ラベルを認識させることにより,擬似ラベルの2つのメカニズムを提案する。
論文 参考訳(メタデータ) (2022-09-19T17:54:17Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Ego2HandsPose: A Dataset for Egocentric Two-hand 3D Global Pose
Estimation [0.0]
Ego2HandsPoseは、目に見えないドメインでカラーベースの2Dトラッキングを可能にする最初のデータセットである。
本研究では,1)1つの画像を用いた3次元手ポーズアノテーションの実現,2)2次元手ポーズから3次元手ポーズへの自動変換,3)時間的整合性を伴う高精度な両手トラッキングを実現するためのパラメトリックフィッティングアルゴリズムの開発を行う。
論文 参考訳(メタデータ) (2022-06-10T07:50:45Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - H3D: Benchmark on Semantic Segmentation of High-Resolution 3D Point
Clouds and textured Meshes from UAV LiDAR and Multi-View-Stereo [4.263987603222371]
本稿では,3つの方法でユニークな3次元データセットを提案する。
ヘシグハイム(ドイツ語: Hessigheim, H3D)は、ドイツの都市。
片手で3次元データ分析の分野での研究を促進するとともに、新しいアプローチの評価とランク付けを目的としている。
論文 参考訳(メタデータ) (2021-02-10T09:33:48Z) - Weakly Supervised Semantic Segmentation in 3D Graph-Structured Point
Clouds of Wild Scenes [36.07733308424772]
3Dセグメンテーションラベルの欠如は、効率的な点雲セグメンテーションの主な障害の1つである。
本稿では,2D のみを監督する点群における大規模セマンティックシーンセグメンテーションのための,新しいディープグラフ畳み込みネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-26T23:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。