論文の概要: IDDA: a large-scale multi-domain dataset for autonomous driving
- arxiv url: http://arxiv.org/abs/2004.08298v2
- Date: Fri, 22 Oct 2021 08:59:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:44:19.305603
- Title: IDDA: a large-scale multi-domain dataset for autonomous driving
- Title(参考訳): IDDA: 自律運転のための大規模マルチドメインデータセット
- Authors: Emanuele Alberti, Antonio Tavera, Carlo Masone, Barbara Caputo
- Abstract要約: 本稿では,100以上の異なる視覚領域を持つセマンティックセグメンテーションのための大規模合成データセットを提案する。
このデータセットは、さまざまな天候や視点条件下でのトレーニングとテストデータのドメインシフトの課題に明示的に対処するために作成されている。
- 参考スコア(独自算出の注目度): 16.101248613062292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation is key in autonomous driving. Using deep visual
learning architectures is not trivial in this context, because of the
challenges in creating suitable large scale annotated datasets. This issue has
been traditionally circumvented through the use of synthetic datasets, that
have become a popular resource in this field. They have been released with the
need to develop semantic segmentation algorithms able to close the visual
domain shift between the training and test data. Although exacerbated by the
use of artificial data, the problem is extremely relevant in this field even
when training on real data. Indeed, weather conditions, viewpoint changes and
variations in the city appearances can vary considerably from car to car, and
even at test time for a single, specific vehicle. How to deal with domain
adaptation in semantic segmentation, and how to leverage effectively several
different data distributions (source domains) are important research questions
in this field. To support work in this direction, this paper contributes a new
large scale, synthetic dataset for semantic segmentation with more than 100
different source visual domains. The dataset has been created to explicitly
address the challenges of domain shift between training and test data in
various weather and view point conditions, in seven different city types.
Extensive benchmark experiments assess the dataset, showcasing open challenges
for the current state of the art. The dataset will be available at:
https://idda-dataset.github.io/home/ .
- Abstract(参考訳): セマンティックセグメンテーションは自動運転の鍵である。
適切な大規模アノテートデータセットを作成する上での課題のため、このコンテキストでは、ディープラーニングアーキテクチャの使用は簡単ではない。
この問題は伝統的に、この分野で人気のあるリソースとなった合成データセットの使用によって回避されてきた。
トレーニングデータとテストデータの間の視覚的ドメインシフトを閉じることのできるセマンティックセグメンテーションアルゴリズムを開発する必要性からリリースされた。
人工データの使用により悪化するが、実データによるトレーニングにおいても、この問題はこの分野において極めて重要である。
実際、天気条件、視点の変化、都市の外観の変化は、車から車、さらには1台の特定の車両のテスト時でさえ、かなり異なる可能性がある。
セマンティックセグメンテーションにおけるドメイン適応の扱い方や、複数の異なるデータ分散(ソースドメイン)を効果的に活用する方法は、この分野において重要な研究課題である。
そこで本稿では,100以上の異なる視覚領域を持つ意味セグメンテーションのための,新しい大規模合成データセットを提案する。
このデータセットは、さまざまな天候や視点条件下でのトレーニングとテストデータのドメインシフトの課題を、7つの異なる都市タイプで明示的に解決するために作られた。
大規模なベンチマーク実験はデータセットを評価し、現在の最先端に対するオープンな課題を示す。
データセットはhttps://idda-dataset.github.io/home/。
関連論文リスト
- Multi-Target Unsupervised Domain Adaptation for Semantic Segmentation without External Data [25.386114973556406]
マルチターゲット非教師付きドメイン適応(UDA)は、複数のターゲットドメイン間のドメインシフトに対応する統一モデルを学ぶことを目的としている。
既存のソリューションのほとんどは、ソースドメインからのラベル付きデータと、トレーニング中に複数のターゲットドメインからのラベルなしデータが必要です。
セマンティックセグメンテーションのための「外部データのないマルチターゲットUDA」という新しい戦略を導入する。
論文 参考訳(メタデータ) (2024-05-10T14:29:51Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - TridentAdapt: Learning Domain-invariance via Source-Target Confrontation
and Self-induced Cross-domain Augmentation [0.0]
主な課題は、仮想データから恩恵を受けるために、入力のドメインに依存しない表現を学ぶことである。
本稿では,対立ソースとターゲット制約を同時に満たすために,共有機能エンコーダを強制するトリデント型アーキテクチャを提案する。
また、フォワードパス中に自己誘導型クロスドメインデータ拡張を可能にする新しいトレーニングパイプラインも導入する。
論文 参考訳(メタデータ) (2021-11-30T11:25:46Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Robust wav2vec 2.0: Analyzing Domain Shift in Self-Supervised
Pre-Training [67.71228426496013]
事前トレーニング中にターゲットドメインデータを使用することで,さまざまなセットアップで大幅なパフォーマンス向上が期待できる。
複数のドメインで事前トレーニングを行うことで、トレーニング中に見られないドメインのパフォーマンスの一般化が向上します。
論文 参考訳(メタデータ) (2021-04-02T12:53:15Z) - DAIL: Dataset-Aware and Invariant Learning for Face Recognition [67.4903809903022]
顔認識の性能向上のためには、通常大規模なトレーニングデータセットが必要である。
2つの大きな問題のために異なるデータセットを自然に組み合わせるのは問題で面倒です。
トレーニング中に異なるデータセットの異なるクラスと同じ人を扱うことは、バックプロパゲーションに影響します。
手動でラベルをクリーニングするには 人的努力が要る 特に何百万もの画像と何千ものIDがある時は
論文 参考訳(メタデータ) (2021-01-14T01:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。