論文の概要: DRIV100: In-The-Wild Multi-Domain Dataset and Evaluation for Real-World
Domain Adaptation of Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2102.00150v1
- Date: Sat, 30 Jan 2021 04:43:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-02 16:38:25.919578
- Title: DRIV100: In-The-Wild Multi-Domain Dataset and Evaluation for Real-World
Domain Adaptation of Semantic Segmentation
- Title(参考訳): DRIV100: In-The-Wild Multi-Domain Dataset and Evaluation for Real-World Domain Adaptation of Semantic Segmentation
- Authors: Haruya Sakashita, Christoph Flothow, Noriko Takemura, Yusuke Sugano
- Abstract要約: 本研究は,インターネットから収集した道路シーン映像の領域適応手法をベンチマークするための,新しいマルチドメインデータセットを提示する。
データセットは、人間の主観的判断と既存の道路シーンデータセットを用いて判断される異常スコアという2つの基準に基づいて、多様なシーン/ドメインをカバーするために選択された100本のビデオに対するピクセルレベルのアノテーションで構成されている。
- 参考スコア(独自算出の注目度): 9.984696742463628
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Together with the recent advances in semantic segmentation, many domain
adaptation methods have been proposed to overcome the domain gap between
training and deployment environments. However, most previous studies use
limited combinations of source/target datasets, and domain adaptation
techniques have never been thoroughly evaluated in a more challenging and
diverse set of target domains. This work presents a new multi-domain dataset
\datasetname~for benchmarking domain adaptation techniques on in-the-wild
road-scene videos collected from the Internet. The dataset consists of
pixel-level annotations for 100 videos selected to cover diverse scenes/domains
based on two criteria; human subjective judgment and an anomaly score judged
using an existing road-scene dataset. We provide multiple manually labeled
ground-truth frames for each video, enabling a thorough evaluation of
video-level domain adaptation where each video independently serves as the
target domain. Using the dataset, we quantify domain adaptation performances of
state-of-the-art methods and clarify the potential and novel challenges of
domain adaptation techniques. The dataset is available at
https://doi.org/10.5281/zenodo.4389243.
- Abstract(参考訳): セマンティックセグメンテーションの最近の進歩とともに、トレーニングとデプロイメント環境の間のドメインギャップを克服する多くのドメイン適応手法が提案されている。
しかし、これまでのほとんどの研究では、ソース/ターゲットデータセットの限られた組み合わせを使用しており、ドメイン適応技術は、より困難で多様なターゲットドメインで徹底的に評価されることはなかった。
本研究は,インターネットから収集した道路シーンビデオの領域適応手法をベンチマークするための,新しいマルチドメインデータセット \datasetname~を提示する。
データセットは、人間の主観的判断と既存の道順データセットを用いて判断される異常スコアという2つの基準に基づいて、多様なシーン/ドメインをカバーするために選択された100ビデオのピクセルレベルのアノテーションで構成されている。
各ビデオに対して複数の手動でラベル付けされた地上構造フレームを提供し、各ビデオが個別に対象領域として機能するビデオレベルドメイン適応の徹底的な評価を可能にする。
このデータセットを用いて、最先端手法のドメイン適応性能を定量化し、ドメイン適応技術の可能性と新しい課題を明らかにする。
データセットはhttps://doi.org/10.5281/zenodo.4389243で入手できる。
関連論文リスト
- Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition [1.2878987353423252]
シーンテキスト認識(STR)において、教師なしドメイン適応(UDA)がますます普及している。
本稿では,StrDA(Stratified Domain Adaptation)アプローチを導入し,学習プロセスにおける領域ギャップの段階的エスカレーションについて検討する。
本稿では,データサンプルの分布外および領域判別レベルを推定するために,領域判別器を用いる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-13T16:40:48Z) - Multi-Modal Domain Adaptation Across Video Scenes for Temporal Video
Grounding [59.599378814835205]
時間的ビデオグラウンドリング(TVG)は、与えられた言語クエリに基づいて、特定のセグメントの時間的境界を未トリミングビデオにローカライズすることを目的としている。
そこで本研究では,対象データからの洞察を取り入れた新たなAMDA手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T07:49:27Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Multi-Domain Incremental Learning for Semantic Segmentation [42.30646442211311]
そこで,同質な意味的特徴を捉えるために,普遍的に共有されるドメイン不変パラメータを割り当てる動的アーキテクチャを提案する。
提案手法が、ドイツ(都市景観)、アメリカ合衆国(BDD100k)、インド(IDD)の道路(都市景観)の実際の運転シーンに関連する領域の漸進的な設定に与える影響を実証する。
論文 参考訳(メタデータ) (2021-10-23T12:21:42Z) - Cross-domain Contrastive Learning for Unsupervised Domain Adaptation [108.63914324182984]
教師なしドメイン適応(Unsupervised domain adapt、UDA)は、完全にラベル付けされたソースドメインから異なるラベル付けされていないターゲットドメインに学習した知識を転送することを目的としている。
対照的な自己教師型学習に基づいて、トレーニングとテストセット間のドメインの相違を低減するために、機能を整列させます。
論文 参考訳(メタデータ) (2021-06-10T06:32:30Z) - Multi-Source Domain Adaptation with Collaborative Learning for Semantic
Segmentation [32.95273803359897]
マルチソース非監視ドメイン適応(MSDA)は、複数のラベル付きソースドメインで訓練されたモデルをラベル付きターゲットドメインに適応することを目的とする。
セマンティックセグメンテーションのための協調学習に基づく新しいマルチソースドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-08T12:51:42Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。