論文の概要: DMSD-CDFSAR: Distillation from Mixed-Source Domain for Cross-Domain Few-shot Action Recognition
- arxiv url: http://arxiv.org/abs/2407.05657v1
- Date: Mon, 8 Jul 2024 06:32:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 16:50:12.362519
- Title: DMSD-CDFSAR: Distillation from Mixed-Source Domain for Cross-Domain Few-shot Action Recognition
- Title(参考訳): DMSD-CDFSAR:クロスドメイン・ファウショット・アクション認識のための混合音源領域からの蒸留
- Authors: Fei Guo, YiKang Wang, Han Qi, Li Zhu, Jing Sun,
- Abstract要約: 少ないショットアクション認識はコンピュータビジョンの新たな分野であり、主に同じドメイン内のメタ学習に焦点を当てている。
本稿では,この問題に対処するための新しいアプローチである「混合ソースドメインからの蒸留」を提案する。
本手法は,トレーニング中に,ソースドメインのラベル付きデータと対象ドメインのラベルなしデータの両方からの洞察を戦略的に統合する。
- 参考スコア(独自算出の注目度): 11.682193360260477
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot action recognition is an emerging field in computer vision, primarily focused on meta-learning within the same domain. However, challenges arise in real-world scenario deployment, as gathering extensive labeled data within a specific domain is laborious and time-intensive. Thus, attention shifts towards cross-domain few-shot action recognition, requiring the model to generalize across domains with significant deviations. Therefore, we propose a novel approach, ``Distillation from Mixed-Source Domain", tailored to address this conundrum. Our method strategically integrates insights from both labeled data of the source domain and unlabeled data of the target domain during the training. The ResNet18 is used as the backbone to extract spatial features from the source and target domains. We design two branches for meta-training: the original-source and the mixed-source branches. In the first branch, a Domain Temporal Encoder is employed to capture temporal features for both the source and target domains. Additionally, a Domain Temporal Decoder is employed to reconstruct all extracted features. In the other branch, a Domain Mixed Encoder is used to handle labeled source domain data and unlabeled target domain data, generating mixed-source domain features. We incorporate a pre-training stage before meta-training, featuring a network architecture similar to that of the first branch. Lastly, we introduce a dual distillation mechanism to refine the classification probabilities of source domain features, aligning them with those of mixed-source domain features. This iterative process enriches the insights of the original-source branch with knowledge from the mixed-source branch, thereby enhancing the model's generalization capabilities. Our code is available at URL: \url{https://xxxx/xxxx/xxxx.git}
- Abstract(参考訳): 少ないショットアクション認識はコンピュータビジョンの新たな分野であり、主に同じドメイン内のメタ学習に焦点を当てている。
しかし、特定のドメイン内で広範囲のラベル付きデータを収集することは手間がかかり、時間を要するため、現実のシナリオ展開では課題が生じる。
このように、注意はドメイン間数発のアクション認識にシフトし、大きな偏差のあるドメインをまたいでモデルを一般化する必要がある。
そこで本研究では,この問題に対処するための新しいアプローチである ``Distillation from Mixed-Source Domain を提案する。
本手法は,トレーニング中に,ソースドメインのラベル付きデータと対象ドメインのラベルなしデータの両方からの洞察を戦略的に統合する。
ResNet18は、ソースとターゲットドメインから空間的特徴を抽出するバックボーンとして使用される。
メタトレーニングのための2つのブランチを設計する。
最初のブランチでは、ソースとターゲットドメインの両方の時間的特徴をキャプチャするために、Domain Temporal Encoderが使用される。
さらに、抽出されたすべての機能を再構築するために、ドメイン時間デコーダが使用される。
もう一方のブランチでは、ラベル付きソースドメインデータとラベルなしターゲットドメインデータを処理するために、Domain Mixed Encoderが使用され、混合ソースドメイン機能を生成する。
メタトレーニングの前にトレーニング済みのステージを組み込み、最初のブランチと同様のネットワークアーキテクチャを特徴とする。
最後に,2つの蒸留機構を導入して,ソース領域の特徴の分類確率を改良し,混合ソース領域の特徴と整合させる。
この反復的プロセスは、原ソースブランチの洞察を混成ソースブランチからの知識で豊かにし、それによってモデルの一般化能力を高める。
私たちのコードはURLで利用可能です。
関連論文リスト
- Multisource Semisupervised Adversarial Domain Generalization Network for
Cross-Scene Sea-Land Clutter Classification [7.258979105586101]
既往の分布不一致を伴う海面干潟のリアルタイム予測は重要である。
本稿では,シーステンダッシュランドクラッタ分類のための多元半教師付きドメイン一般化ネットワーク(MSADGN)を提案する。
MSADGNはドメイン関連擬似ラベルモジュール、ドメイン不変モジュール、ドメイン固有モジュールの3つのモジュールから構成される。
論文 参考訳(メタデータ) (2024-02-09T10:50:28Z) - Noisy Universal Domain Adaptation via Divergence Optimization for Visual
Recognition [30.31153237003218]
ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送する、Noisy UniDAという新しいシナリオが提案されている。
ノイズUniDAで直面するすべての課題に同時に対処するために、マルチヘッド畳み込みニューラルネットワークフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-04-20T14:18:38Z) - A Two-Stage Framework with Self-Supervised Distillation For Cross-Domain Text Classification [46.47734465505251]
クロスドメインテキスト分類は、ラベル付きデータを持たないターゲットドメインにモデルを適応させることを目的としている。
クロスドメインテキスト分類のための2段階フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-18T06:21:40Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - Bridging the Source-to-target Gap for Cross-domain Person
Re-Identification with Intermediate Domains [63.23373987549485]
クロスドメインの人物再識別(re-ID)は、ソースからターゲットドメインに識別された知識を転送することを目的としている。
中間ドメインモジュール(IDM)とミラー生成モジュール(MGM)を提案する。
IDMは、ソースドメインとターゲットドメインから隠れた層の特徴を混合することにより、複数の中間ドメインを生成する。
MGMは、特徴をIDM生成中間ドメインにマッピングすることで、元のアイデンティティを変更することなく導入される。
論文 参考訳(メタデータ) (2022-03-03T12:44:56Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Curriculum CycleGAN for Textual Sentiment Domain Adaptation with
Multiple Sources [68.31273535702256]
我々は,C-CycleGAN(C-CycleGAN)という,新しいインスタンスレベルのMDAフレームワークを提案する。
C-CycleGANは、(1)異なるドメインからのテキスト入力を連続的な表現空間にエンコードする事前訓練されたテキストエンコーダ、(2)ソースとターゲットドメイン間のギャップを埋めるカリキュラムインスタンスレベルの適応を伴う中間ドメインジェネレータ、(3)中間ドメインで最終感情分類のために訓練されたタスク分類器の3つのコンポーネントから構成される。
3つのベンチマークデータセットに対して広範な実験を行い、最先端のDAアプローチよりも大幅に向上した。
論文 参考訳(メタデータ) (2020-11-17T14:50:55Z) - Deep Domain-Adversarial Image Generation for Domain Generalisation [115.21519842245752]
マシンラーニングモデルは通常、ソースデータセットでトレーニングされたり、異なるディストリビューションのターゲットデータセットで評価されたりする際に、ドメインシフトの問題に悩まされる。
この問題を解決するために、ドメイン一般化(DG)手法は、訓練されたモデルが未知のドメインに一般化できるように、複数のソースドメインからのデータを活用することを目的としている。
我々はemphDeep Domain-Adversarial Image Generation (DDAIG)に基づく新しいDG手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T23:17:47Z) - MADAN: Multi-source Adversarial Domain Aggregation Network for Domain
Adaptation [58.38749495295393]
ドメイン適応は、あるラベル付きソースドメインと、わずかにラベル付けまたはラベル付けされていないターゲットドメインの間のドメインシフトをブリッジするために、転送可能なモデルを学ぶことを目的としています。
近年のマルチソース領域適応法(MDA)では,ソースとターゲット間の画素レベルのアライメントは考慮されていない。
これらの課題に対処するための新しいMDAフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T21:22:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。