論文の概要: Adversarially Masked Video Consistency for Unsupervised Domain Adaptation
- arxiv url: http://arxiv.org/abs/2403.16242v1
- Date: Sun, 24 Mar 2024 17:13:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 16:46:40.422927
- Title: Adversarially Masked Video Consistency for Unsupervised Domain Adaptation
- Title(参考訳): 教師なし領域適応のための逆マスク映像整合性
- Authors: Xiaoyu Zhu, Junwei Liang, Po-Yao Huang, Alex Hauptmann,
- Abstract要約: 自己中心型ビデオにおける教師なしドメイン適応の問題について検討する。
本稿では,クラス識別的特徴表現とドメイン不変特徴表現を学習するトランスフォーマーモデルを提案する。
- 参考スコア(独自算出の注目度): 11.947273267877208
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study the problem of unsupervised domain adaptation for egocentric videos. We propose a transformer-based model to learn class-discriminative and domain-invariant feature representations. It consists of two novel designs. The first module is called Generative Adversarial Domain Alignment Network with the aim of learning domain-invariant representations. It simultaneously learns a mask generator and a domain-invariant encoder in an adversarial way. The domain-invariant encoder is trained to minimize the distance between the source and target domain. The masking generator, conversely, aims at producing challenging masks by maximizing the domain distance. The second is a Masked Consistency Learning module to learn class-discriminative representations. It enforces the prediction consistency between the masked target videos and their full forms. To better evaluate the effectiveness of domain adaptation methods, we construct a more challenging benchmark for egocentric videos, U-Ego4D. Our method achieves state-of-the-art performance on the Epic-Kitchen and the proposed U-Ego4D benchmark.
- Abstract(参考訳): 自己中心型ビデオにおける教師なしドメイン適応の問題について検討する。
本稿では,クラス識別的特徴表現とドメイン不変特徴表現を学習するトランスフォーマーモデルを提案する。
2つの新しいデザインで構成されている。
最初のモジュールはGenerative Adversarial Domain Alignment Networkと呼ばれ、ドメイン不変表現の学習を目的としている。
マスクジェネレータとドメイン不変エンコーダを対角的に同時に学習する。
ドメイン不変エンコーダは、ソースとターゲットドメイン間の距離を最小限に抑えるために訓練される。
逆にマスク生成器は、ドメイン距離を最大化し、挑戦的なマスクを生成することを目的としている。
2つ目は、クラス識別表現を学習するMasked Consistency Learningモジュールである。
マスクされたターゲットビデオとそのフルフォーム間の予測一貫性を強制する。
ドメイン適応手法の有効性をよりよく評価するために,エゴセントリックビデオのより困難なベンチマークであるU-Ego4Dを構築した。
提案手法は,Epic-Kitchenと提案したU-Ego4Dベンチマークの最先端性能を実現する。
関連論文リスト
- Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Domain Invariant Masked Autoencoders for Self-supervised Learning from
Multi-domains [73.54897096088149]
マルチドメインからの自己教師型学習のためのドメイン不変のMasked AutoEncoder (DiMAE)を提案する。
中心となる考え方は、入力画像を異なるドメインからのスタイルノイズで拡張し、拡張イメージの埋め込みからイメージを再構築することである。
PACSとDomainNetの実験は、最近の最先端の手法と比較して、DiMAEがかなりの利益を得ていることを示している。
論文 参考訳(メタデータ) (2022-05-10T09:49:40Z) - Contrast and Mix: Temporal Contrastive Video Domain Adaptation with
Background Mixing [55.73722120043086]
Contrast and Mix(CoMix)は、教師なしビデオドメイン適応のための識別的不変な特徴表現を学習することを目的とした、新しいコントラスト学習フレームワークである。
まず,2つの異なる速度でラベル付きビデオの符号化表現の類似性を最大化することにより,時間的コントラスト学習を用いてドメインギャップをブリッジする。
第2に,両ドメイン間で共有されるアクションセマンティクスを活用するために,アンカー毎の肯定的な追加を可能にするバックグラウンドミキシングを用いることにより,時間的コントラスト損失の新たな拡張を提案する。
論文 参考訳(メタデータ) (2021-10-28T14:03:29Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Domain adaptation techniques for improved cross-domain study of galaxy
mergers [0.0]
天文学では、ニューラルネットワークは実観測に適用される見込みのあるシミュレーションデータでしばしば訓練される。
ここでは、最大平均離散性(MMD)とドメイン対向ニューラルネットワーク(DANN)を用いた対角トレーニングの2つの手法を実証する。
従来の機械学習アルゴリズムと比較して,MDD と逆学習のどちらを追加しても,対象領域における分類器の性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-11-06T20:42:32Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z) - Unsupervised Domain Adaptive Object Detection using Forward-Backward
Cyclic Adaptation [13.163271874039191]
本稿では,フォワード・バック・サイクリック(FBC)トレーニングによる物体検出のための教師なし領域適応手法を提案する。
近年, 対角訓練に基づく領域適応法は, 限界特徴分布アライメントによる領域差最小化に有効であることが示された。
本稿では,後方ホッピングによるソースからターゲットへの適応と,前方通過によるターゲットからソースへの適応を反復的に計算するフォワード・バック・サイクル適応を提案する。
論文 参考訳(メタデータ) (2020-02-03T06:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。