論文の概要: Few-shot Adaptive Object Detection with Cross-Domain CutMix
- arxiv url: http://arxiv.org/abs/2208.14586v1
- Date: Wed, 31 Aug 2022 01:26:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-01 13:02:45.222437
- Title: Few-shot Adaptive Object Detection with Cross-Domain CutMix
- Title(参考訳): クロスドメインカットミクスを用いた少数の適応物体検出
- Authors: Yuzuru Nakamura, Yasunori Ishii, Yuki Maruyama, Takayoshi Yamashita
- Abstract要約: オブジェクト検出では、データ量とコストはトレードオフであり、特定の領域における大量のデータ収集は労働集約的である。
本稿では,大規模な領域ギャップ問題を解決するデータ合成手法を提案する。
提案手法は,従来の手法とは全く異なる領域問題設定で高い精度を実現する。
- 参考スコア(独自算出の注目度): 5.432990262699911
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In object detection, data amount and cost are a trade-off, and collecting a
large amount of data in a specific domain is labor intensive. Therefore,
existing large-scale datasets are used for pre-training. However, conventional
transfer learning and domain adaptation cannot bridge the domain gap when the
target domain differs significantly from the source domain. We propose a data
synthesis method that can solve the large domain gap problem. In this method, a
part of the target image is pasted onto the source image, and the position of
the pasted region is aligned by utilizing the information of the object
bounding box. In addition, we introduce adversarial learning to discriminate
whether the original or the pasted regions. The proposed method trains on a
large number of source images and a few target domain images. The proposed
method achieves higher accuracy than conventional methods in a very different
domain problem setting, where RGB images are the source domain, and thermal
infrared images are the target domain. Similarly, the proposed method achieves
higher accuracy in the cases of simulation images to real images.
- Abstract(参考訳): オブジェクト検出では、データ量とコストはトレードオフであり、特定の領域における大量のデータ収集は労働集約的である。
そのため、既存の大規模データセットは事前トレーニングに使用される。
しかし、従来の転送学習やドメイン適応は、対象ドメインがソースドメインと大きく異なる場合にドメインギャップを埋めることはできない。
本稿では,大規模領域間隙問題を解決するデータ合成手法を提案する。
この方法では、対象画像の一部がソース画像に貼付され、被写体バウンディングボックスの情報を利用して被写体領域の位置が整列される。
また,本論文では,オリジナル領域とペースト領域を区別するために,逆学習を導入する。
提案手法では,多数のソースイメージと少数のターゲットドメインイメージをトレーニングする。
提案手法は,rgb画像がソース領域であり,熱赤外画像がターゲット領域である,まったく異なる領域問題設定において,従来の手法よりも高精度である。
同様に,提案手法は実画像に対するシミュレーション画像の精度を向上させる。
関連論文リスト
- Source-free Domain Adaptive Object Detection in Remote Sensing Images [11.19538606490404]
本研究では,RS画像のソースフリーオブジェクト検出(SFOD)設定を提案する。
これは、ソース事前学習モデルのみを使用してターゲットドメイン適応を実行することを目的としている。
本手法では,ソース領域RS画像へのアクセスは不要である。
論文 参考訳(メタデータ) (2024-01-31T15:32:44Z) - DARC: Distribution-Aware Re-Coloring Model for Generalizable Nucleus
Segmentation [68.43628183890007]
ドメインギャップは、異なるフォアグラウンド(核)-バックグラウンド比によっても引き起こされる可能性があると我々は主張する。
まず、異なる領域間の劇的な画像色変化を緩和する再カラー化手法を提案する。
次に,前景-背景比の変動に頑健な新しいインスタンス正規化手法を提案する。
論文 参考訳(メタデータ) (2023-09-01T01:01:13Z) - Domain Agnostic Image-to-image Translation using Low-Resolution
Conditioning [6.470760375991825]
ドメインが関係するきめ細かい問題に対して,ドメインに依存しないi2i法を提案する。
本稿では、生成モデルを訓練し、関連するソース画像の固有情報を共有する画像を生成する新しいアプローチを提案する。
CelebA-HQ と AFHQ のデータセット上で,視覚的品質の向上を実証し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-05-08T19:58:49Z) - Ranking Distance Calibration for Cross-Domain Few-Shot Learning [91.22458739205766]
数ショット学習の最近の進歩は、より現実的なクロスドメイン設定を促進する。
ドメインギャップとソースとターゲットデータセット間のラベル空間の相違により、共有される知識は極めて限られている。
我々は,タスク内の相互k-アネレスト近傍を発見することで,目標距離行列の校正を行う。
論文 参考訳(メタデータ) (2021-12-01T03:36:58Z) - Disentangled Unsupervised Image Translation via Restricted Information
Flow [61.44666983942965]
多くの最先端のメソッドは、所望の共有vs固有の分割をアーキテクチャにハードコードする。
帰納的アーキテクチャバイアスに依存しない新しい手法を提案する。
提案手法は,2つの合成データセットと1つの自然なデータセットに対して一貫した高い操作精度を実現する。
論文 参考訳(メタデータ) (2021-11-26T00:27:54Z) - Multilevel Knowledge Transfer for Cross-Domain Object Detection [26.105283273950942]
ドメインシフトは、特定のドメイン(ソース)でトレーニングされたモデルが、異なるドメイン(ターゲット)のサンプルに露出しても、うまく動作しない、よく知られた問題である。
本研究では,オブジェクト検出タスクにおける領域シフト問題に対処する。
私たちのアプローチは、ソースとターゲットドメイン間のドメインシフトを徐々に削除することに依存しています。
論文 参考訳(メタデータ) (2021-08-02T15:24:40Z) - Few-shot Image Generation via Cross-domain Correspondence [98.2263458153041]
限られた例を含む対象領域におけるGANなどの生成モデルの訓練は、容易に過度な適合をもたらす。
本研究では,多様性情報をソースからターゲットにプリトレーニングし,転送するために,大きなソースドメインを活用することを目指す。
さらに,オーバーフィッティングを減らすために,潜在空間内の異なる領域に対して異なるレベルのリアリズムを奨励するアンカーベースの戦略を提案する。
論文 参考訳(メタデータ) (2021-04-13T17:59:35Z) - Six-channel Image Representation for Cross-domain Object Detection [17.854940064699985]
ディープラーニングモデルはデータ駆動であり、優れたパフォーマンスは豊富で多様なデータセットに依存する。
いくつかの画像から画像への翻訳技術は、モデルを訓練するために特定のシーンの偽データを生成するために用いられる。
3チャンネル画像とそのgan生成した偽画像に刺激を与え,データセットの6チャンネル表現を作成することを提案する。
論文 参考訳(メタデータ) (2021-01-03T04:50:03Z) - Discriminative Cross-Domain Feature Learning for Partial Domain
Adaptation [70.45936509510528]
部分的なドメイン適応は、より大きく多様なソースドメインからの知識を、より少ないクラス数でより小さなターゲットドメインに適応させることを目的としています。
ドメイン適応の最近の実践は、ターゲットドメインの擬似ラベルを組み込むことで、効果的な特徴を抽出する。
ターゲットデータを少数のソースデータのみにアライメントすることが不可欠である。
論文 参考訳(メタデータ) (2020-08-26T03:18:53Z) - TriGAN: Image-to-Image Translation for Multi-Source Domain Adaptation [82.52514546441247]
本稿では,ジェネレーティブ・アドバイサル・ネットワークに基づくマルチソース・ドメイン適応(MSDA)の最初のアプローチを提案する。
本手法は,画像の出現がドメイン,スタイル,内容の3つの要因に依存するという観察に着想を得たものである。
提案手法はMSDAベンチマークを用いて試行し,最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-19T05:07:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。