論文の概要: EPIC-KITCHENS-100 Unsupervised Domain Adaptation Challenge for Action
Recognition 2021: Team M3EM Technical Report
- arxiv url: http://arxiv.org/abs/2106.10026v1
- Date: Fri, 18 Jun 2021 10:03:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-21 14:05:38.234330
- Title: EPIC-KITCHENS-100 Unsupervised Domain Adaptation Challenge for Action
Recognition 2021: Team M3EM Technical Report
- Title(参考訳): EPIC-KITCHENS-100 Unsupervised Domain Adaptation Challenge for Action Recognition 2021: Team M3EM Technical Report
- Authors: Lijin Yang, Yifei Huang, Yusuke Sugano, Yoichi Sato
- Abstract要約: 複数のモダリティを活用することで、Unsupervised Domain Adaptationタスクのメリットが証明されている。
マルチモーダル・ミューチュアル・エンハンスメント・モジュール (M3EM) は、複数のモーダルからの情報を共同で検討し、ドメイン間で最も転送可能な表現を見つけるモジュールである。
- 参考スコア(独自算出の注目度): 39.29955809641396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this report, we describe the technical details of our submission to the
2021 EPIC-KITCHENS-100 Unsupervised Domain Adaptation Challenge for Action
Recognition. Leveraging multiple modalities has been proved to benefit the
Unsupervised Domain Adaptation (UDA) task. In this work, we present Multi-Modal
Mutual Enhancement Module (M3EM), a deep module for jointly considering
information from multiple modalities to find the most transferable
representations across domains. We achieve this by implementing two sub-modules
for enhancing each modality using the context of other modalities. The first
sub-module exchanges information across modalities through the semantic space,
while the second sub-module finds the most transferable spatial region based on
the consensus of all modalities.
- Abstract(参考訳): 本報告では,2021年のepic-kitchens-100unsupervised domain adaptation challenge for action recognitionの技術的詳細について述べる。
複数のモダリティを活用することで、Unsupervised Domain Adaptation (UDA)タスクの恩恵が証明されている。
本研究では,複数のモードからの情報を協調的に検討し,ドメイン間で最も転送可能な表現を見つけるための深層モジュールであるM3EMを提案する。
これを実現するために、他のモダリティの文脈を用いて各モダリティを強化する2つのサブモジュールを実装する。
第1のサブモジュールは意味空間を通してモダリティ間の情報を交換し、第2のサブモジュールは全てのモダリティのコンセンサスに基づいて最も転送可能な空間領域を見つける。
関連論文リスト
- Role Prompting Guided Domain Adaptation with General Capability Preserve
for Large Language Models [55.51408151807268]
特定のドメインに合わせると、LLM(Large Language Models)は破滅的な忘れを経験する傾向がある。
同時に複数のドメインのための汎用モデルを構築することで、全体的なパフォーマンスが低下することが多い。
RolE Prompting Guided Multi-Domain Adaptation (REGA) 戦略を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:22:41Z) - Virtual Classification: Modulating Domain-Specific Knowledge for
Multidomain Crowd Counting [67.38137379297717]
マルチドメインのクラウドカウントは、複数の多様なデータセットの一般的なモデルを学ぶことを目的としている。
ディープネットワークは、ドメインバイアスとして知られるすべてのドメインではなく、支配的なドメインの分布をモデル化することを好む。
マルチドメイン群カウントにおけるドメインバイアス問題を処理するために,MDKNet(Modulating Domain-specific Knowledge Network)を提案する。
論文 参考訳(メタデータ) (2024-02-06T06:49:04Z) - SimMMDG: A Simple and Effective Framework for Multi-modal Domain
Generalization [13.456240733175767]
SimMMDGは、マルチモーダルシナリオにおけるドメインの一般化を実現する上での課題を克服するためのフレームワークである。
我々は,共同性を確保し,距離制約を課すために,モダリティ共有特徴に対する教師付きコントラスト学習を採用する。
本研究では,EPIC-KitchensデータセットとHuman-Animal-CartoonデータセットのマルチモーダルDGにおいて,理論的に支持され,高い性能を実現している。
論文 参考訳(メタデータ) (2023-10-30T17:58:09Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - PoliTO-IIT-CINI Submission to the EPIC-KITCHENS-100 Unsupervised Domain
Adaptation Challenge for Action Recognition [16.496889090237232]
本報告では,EPIC-Kitchens-100 Unsupervised Domain Adaptation Challenge in Action Recognitionへの提出の技術的詳細について述べる。
我々はRelative Norm Alignment (RNA)と呼ばれる最近のドメイン一般化手法を最初に利用した。
第二に、この手法を非競合対象データに拡張し、教師なしの方法でモデルが対象分布に適応することを可能にした。
論文 参考訳(メタデータ) (2022-09-09T21:03:11Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - ADAS: A Direct Adaptation Strategy for Multi-Target Domain Adaptive
Semantic Segmentation [12.148050135641583]
ドメイン間の視覚的属性を整列するマルチターゲットドメイン転送ネットワーク(MTDT-Net)を設計する。
また、クラスラベル間の属性のあいまいさを低減する双方向適応型領域選択(BARS)を提案する。
本手法は,セマンティックセグメンテーションにおいて複数のドメインに直接適応する最初のMTDA法である。
論文 参考訳(メタデータ) (2022-03-14T01:55:42Z) - PoliTO-IIT Submission to the EPIC-KITCHENS-100 Unsupervised Domain
Adaptation Challenge for Action Recognition [15.545769463854915]
本報告では,EPIC-Kitchens-100 Unsupervised Domain Adaptation (UDA) Challenge in Action Recognitionについて述べる。
我々は、Relative Norm Alignment (RNA)と呼ばれる最近のドメイン一般化(DG)技術を利用した。
第2のフェーズでは、非競合対象データに対するアプローチを拡張し、教師なしの方法で対象分布に適応できるようにした。
私たちの提出(エントリー「plnet」)は、リーダーボードに表示され、"verb"で1位、"noun"と"action"で3位に達した。
論文 参考訳(メタデータ) (2021-07-01T10:02:44Z) - Team PyKale (xy9) Submission to the EPIC-Kitchens 2021 Unsupervised
Domain Adaptation Challenge for Action Recognition [12.905251261775405]
本報告では,EPIC-Kitchens 2021 Unsupervised Domain Adaptation Challenge for Action Recognitionの技術的詳細について述べる。
EPIC-Kitchensデータセットは、よりモダリティの高いマルチタスクのため、他のビデオドメイン適応データセットよりも難しい。
チーム名xy9では,動詞クラスとすべてのトップ5の精度でトップ1の精度で5位にランクインした。
論文 参考訳(メタデータ) (2021-06-22T19:17:03Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。