論文の概要: Achieving Domain Generalization in Underwater Object Detection by Image
Stylization and Domain Mixup
- arxiv url: http://arxiv.org/abs/2104.02230v1
- Date: Tue, 6 Apr 2021 01:45:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:10:44.884995
- Title: Achieving Domain Generalization in Underwater Object Detection by Image
Stylization and Domain Mixup
- Title(参考訳): 画像スタイライゼーションとドメインミックスアップによる水中物体検出における領域一般化の実現
- Authors: Pinhao Song, Linhui Dai, Peipei Yuan, Hong Liu and Runwei Ding
- Abstract要約: 既存の水中物体検出手法は複雑な水中環境に起因する領域シフト問題に直面すると深刻に劣化する。
本稿では,データ拡張の観点からのドメイン一般化手法を提案する。
S-UODAC 2020データセットに関する総合的な実験は、提案手法がドメイン不変表現を学習できることを実証している。
- 参考スコア(独自算出の注目度): 8.983901488753967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of existing underwater object detection methods degrades
seriously when facing domain shift problem caused by complicated underwater
environments. Due to the limitation of the number of domains in the dataset,
deep detectors easily just memorize a few seen domain, which leads to low
generalization ability. Ulteriorly, it can be inferred that the detector
trained on as many domains as possible is domain-invariant. Based on this
viewpoint, we propose a domain generalization method from the aspect of data
augmentation. First, the style transfer model transforms images from one source
domain to another, enriching the domain diversity of the training data. Second,
interpolating different domains on feature level, new domains can be sampled on
the domain manifold. With our method, detectors will be robust to domain shift.
Comprehensive experiments on S-UODAC2020 datasets demonstrate that the proposed
method is able to learn domain-invariant representations, and outperforms other
domain generalization methods. The source code is available at
https://github.com/mousecpn.
- Abstract(参考訳): 複雑な水中環境による領域シフト問題に直面した場合,既存の水中物体検出手法の性能は著しく低下する。
データセット内のドメイン数が制限されているため、ディープ検出器はごくわずかのドメインを記憶するだけで、一般化能力の低下につながる。
極端に、できるだけ多くのドメインで訓練された検出器がドメイン不変であると推測できる。
この観点から,データ拡張の観点からドメイン一般化手法を提案する。
まず、スタイル転送モデルは、あるソースドメインから別のソースドメインへ画像を変換し、トレーニングデータのドメインの多様性を高める。
第二に、異なるドメインを特徴レベルで補間すると、新しいドメインはドメイン多様体上でサンプリングできる。
我々の方法では、検出器はドメインシフトに対して堅牢である。
S-UODAC2020データセットに関する総合的な実験は、提案手法がドメイン不変表現を学習し、他のドメイン一般化手法より優れていることを示す。
ソースコードはhttps://github.com/mousecpnで入手できる。
関連論文リスト
- Domain-Rectifying Adapter for Cross-Domain Few-Shot Segmentation [40.667166043101076]
多様なターゲットドメインスタイルをソースドメインに修正するための小さなアダプタを提案する。
アダプタは、さまざまな合成対象ドメインから画像特徴を修正して、ソースドメインと整合するように訓練される。
提案手法は,ドメイン間複数ショットセマンティックセマンティックセグメンテーションタスクにおいて有望な結果を得る。
論文 参考訳(メタデータ) (2024-04-16T07:07:40Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Aggregation of Disentanglement: Reconsidering Domain Variations in
Domain Generalization [9.577254317971933]
ドメイン変種には、下流のタスクに有用な情報、すなわち分類対応情報も含まれている、と我々は主張する。
本稿では,ドメインエキスパートの特徴をソース・ドメイン・イメージから切り離すために,DDN(Domain Disentanglement Network)と呼ばれる新しいパラダイムを提案する。
また、ドメインの専門家がよりバランスよく分離可能な機能空間を形成するための、新しい対照的な学習方法を提案します。
論文 参考訳(メタデータ) (2023-02-05T09:48:57Z) - Multi-Scale Multi-Target Domain Adaptation for Angle Closure
Classification [50.658613573816254]
角度閉包分類のためのM2DAN(Multi-scale Multi-target Domain Adversarial Network)を提案する。
異なるスケールでのこれらのドメイン不変性に基づいて、ソースドメインで訓練されたディープモデルは、複数のターゲットドメインの角度クロージャを分類することができる。
論文 参考訳(メタデータ) (2022-08-25T15:27:55Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Multilevel Knowledge Transfer for Cross-Domain Object Detection [26.105283273950942]
ドメインシフトは、特定のドメイン(ソース)でトレーニングされたモデルが、異なるドメイン(ターゲット)のサンプルに露出しても、うまく動作しない、よく知られた問題である。
本研究では,オブジェクト検出タスクにおける領域シフト問題に対処する。
私たちのアプローチは、ソースとターゲットドメイン間のドメインシフトを徐々に削除することに依存しています。
論文 参考訳(メタデータ) (2021-08-02T15:24:40Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。
一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-11-25T12:02:57Z) - Improved Multi-Source Domain Adaptation by Preservation of Factors [0.0]
ドメイン適応(DA)は、ディープニューラルネットワークによる画像分類に関して、非常に関連する研究トピックである。
本稿では,現実のシーンが一般的に画像に現れる視覚的要因の理論に基づいて述べる。
異なるドメインはドメイン内で一貫した値を持つが、ドメイン間で変更できるいわゆるドメインファクターによって記述できることを示す。
論文 参考訳(メタデータ) (2020-10-15T14:19:57Z) - Domain2Vec: Domain Embedding for Unsupervised Domain Adaptation [56.94873619509414]
従来の教師なしドメイン適応は、限られた数のドメイン間の知識伝達を研究する。
本稿では,特徴不整合とグラム行列の連成学習に基づいて,視覚領域のベクトル表現を提供する新しいDomain2Vecモデルを提案する。
我々の埋め込みは、異なるドメイン間の視覚的関係に関する直感と一致するドメイン類似性を予測できることを示した。
論文 参考訳(メタデータ) (2020-07-17T22:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。