論文の概要: Few-Shot Object Detection in Unseen Domains
- arxiv url: http://arxiv.org/abs/2204.05072v1
- Date: Mon, 11 Apr 2022 13:16:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 16:51:26.584975
- Title: Few-Shot Object Detection in Unseen Domains
- Title(参考訳): 未検出領域における少数ショット物体検出
- Authors: Karim Guirguis, George Eskandar, Matthias Kayser, Bin Yang, Juergen
Beyerer
- Abstract要約: Few-shot Object Detection (FSOD)は、データ制限のある新しいオブジェクトクラスを学ぶために近年発展している。
そこで本稿では,ドメイン固有の情報をすべて考慮し,新しいクラスを数枚追加する手法を提案する。
T-LESSデータセットを用いた実験により,提案手法はドメインギャップを著しく緩和することに成功した。
- 参考スコア(独自算出の注目度): 4.36080478413575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) has thrived in recent years to learn novel
object classes with limited data by transfering knowledge gained on abundant
base classes. FSOD approaches commonly assume that both the scarcely provided
examples of novel classes and test-time data belong to the same domain.
However, this assumption does not hold in various industrial and robotics
applications (e.g., object grasping and manipulation), where a model can learn
novel classes from a source domain while inferring on classes from a different
target domain. In this work, we address the task of zero-shot domain
adaptation, also known as domain generalization, for FSOD. Specifically, we
assume that neither images nor labels of the novel classes in the target domain
are available during training. Our approach for solving the domain gap is
two-fold. First, we leverage a meta-training paradigm, where we learn
domain-invariant features on the base classes. Second, we propose various data
augmentations techniques on the few shots of novel classes to account for all
possible domain-specific information. To further constraint the network into
encoding domain-agnostic class-specific representations only, a contrastive
loss is proposed to maximize the mutual information between foreground
proposals and class prototypes, and to reduce the network's bias to the
background information. Our experiments on the T-LESS dataset show that the
proposed approach succeeds in alleviating the domain gap considerably without
utilizing labels or images of novel categories from the target domain.
- Abstract(参考訳): Few-shot Object Detection (FSOD) は、豊富なベースクラスで得られた知識を伝達することによって、限られたデータを持つ新しいオブジェクトクラスを学ぶために近年発展してきた。
fsodのアプローチは一般的に、新しいクラスの例とテスト時のデータが同じドメインに属すると仮定している。
しかし、この仮定は様々な産業やロボティクスの応用(例えば、オブジェクトの把握や操作)には当てはまらないため、モデルが異なる対象領域からクラスを推論しながら、ソースドメインから新しいクラスを学習することができる。
本稿では,fsodにおけるゼロショット領域適応(ドメイン一般化としても知られる)の課題について述べる。
具体的には,対象領域における新規クラスの画像やラベルは,トレーニング中に利用できないと仮定する。
ドメインギャップを解決するためのアプローチは2つあります。
まず、メタトレーニングのパラダイムを利用して、ベースクラスでドメイン不変の機能を学びます。
第2に、ドメイン固有の情報をすべて考慮し、いくつかの新しいクラスのショットに対して様々なデータ拡張手法を提案する。
さらに、ネットワークをドメインに依存しないクラス固有表現のみを符号化することに制限するため、前景提案とクラスプロトタイプ間の相互情報を最大化し、背景情報に対するネットワークのバイアスを低減するための対比的損失を提案する。
T-LESSデータセットを用いた実験により,提案手法は対象領域からの新規カテゴリのラベルや画像を活用することなく,領域ギャップを著しく緩和することに成功した。
関連論文リスト
- Domain Adaptive Few-Shot Open-Set Learning [36.39622440120531]
本稿では,DA-FSOS(Domain Adaptive Few-Shot Open Set Recognition)を提案する。
我々のトレーニングアプローチは、DAFOS-NETがターゲットドメインの新しいシナリオにうまく適応できるようにします。
本稿では,Office-Home,mini-ImageNet/CUB,DomainNetデータセットに基づくDA-FSOSの3つのベンチマークを示す。
論文 参考訳(メタデータ) (2023-09-22T12:04:47Z) - Few-Shot Classification in Unseen Domains by Episodic Meta-Learning
Across Visual Domains [36.98387822136687]
興味のあるカテゴリのラベル付き例がほとんどないため、いくつかのショット分類は、分類を実行することを目的としている。
本稿では,ドメイン一般化型少ショット分類のための一意学習フレームワークを提案する。
メタ学習戦略を進めることで、学習フレームワークは複数のソースドメインにまたがるデータを利用して、ドメイン不変の機能をキャプチャします。
論文 参考訳(メタデータ) (2021-12-27T06:54:11Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Cross-domain Contrastive Learning for Unsupervised Domain Adaptation [108.63914324182984]
教師なしドメイン適応(Unsupervised domain adapt、UDA)は、完全にラベル付けされたソースドメインから異なるラベル付けされていないターゲットドメインに学習した知識を転送することを目的としている。
対照的な自己教師型学習に基づいて、トレーニングとテストセット間のドメインの相違を低減するために、機能を整列させます。
論文 参考訳(メタデータ) (2021-06-10T06:32:30Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Towards Recognizing New Semantic Concepts in New Visual Domains [9.701036831490768]
我々は、これまで見えない視覚領域で機能し、新しいセマンティックな概念を認識できるディープアーキテクチャを設計することが重要であると論じている。
論文の第1部では、深層モデルが新しいビジュアルドメインに一般化できるように、異なるソリューションについて記述する。
第2部では、事前訓練された深層モデルの知識を、元のトレーニングセットにアクセスすることなく、新しい意味概念に拡張する方法を示す。
論文 参考訳(メタデータ) (2020-12-16T16:23:40Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z) - Handling new target classes in semantic segmentation with domain
adaptation [34.11498666008825]
対象領域における"バウンダリレス"適応を実現するためのフレームワークを提案する。
これは、ソースとターゲットのドメインギャップを埋めるために、新しいアーキテクチャと専用の学習スキームに依存しています。
私たちのフレームワークは、ベースラインをかなりのマージンで上回ります。
論文 参考訳(メタデータ) (2020-04-02T16:59:57Z) - Mind the Gap: Enlarging the Domain Gap in Open Set Domain Adaptation [65.38975706997088]
オープンセットドメイン適応(OSDA)は、ターゲットドメインに未知のクラスが存在することを前提としている。
既存の最先端手法は、より大きなドメインギャップが存在する場合、かなりの性能低下を被ることを示す。
我々は、より大きなドメインギャップに特に対処するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-08T14:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。