論文の概要: Aligning Correlation Information for Domain Adaptation in Action
Recognition
- arxiv url: http://arxiv.org/abs/2107.04932v1
- Date: Sun, 11 Jul 2021 00:13:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 16:19:28.949409
- Title: Aligning Correlation Information for Domain Adaptation in Action
Recognition
- Title(参考訳): 行動認識における領域適応のための相関情報の調整
- Authors: Yuecong Xu, Jianfei Yang, Haozhi Cao, Kezhi Mao, Jianxiong Yin, Simon
See
- Abstract要約: 本稿では,画素相関の整合によるアクションビデオの整合化を目的とした新しい適応ネットワーク(ACAN)を提案する。
ACANは、Pixel correlation Discrepancy (PCD)として相関情報の分布を最小化することを目的としている。
- 参考スコア(独自算出の注目度): 14.586677030468339
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Domain adaptation (DA) approaches address domain shift and enable networks to
be applied to different scenarios. Although various image DA approaches have
been proposed in recent years, there is limited research towards video DA. This
is partly due to the complexity in adapting the different modalities of
features in videos, which includes the correlation features extracted as
long-term dependencies of pixels across spatiotemporal dimensions. The
correlation features are highly associated with action classes and proven their
effectiveness in accurate video feature extraction through the supervised
action recognition task. Yet correlation features of the same action would
differ across domains due to domain shift. Therefore we propose a novel
Adversarial Correlation Adaptation Network (ACAN) to align action videos by
aligning pixel correlations. ACAN aims to minimize the distribution of
correlation information, termed as Pixel Correlation Discrepancy (PCD).
Additionally, video DA research is also limited by the lack of cross-domain
video datasets with larger domain shifts. We, therefore, introduce a novel
HMDB-ARID dataset with a larger domain shift caused by a larger statistical
difference between domains. This dataset is built in an effort to leverage
current datasets for dark video classification. Empirical results demonstrate
the state-of-the-art performance of our proposed ACAN for both existing and the
new video DA datasets.
- Abstract(参考訳): ドメイン適応(DA)はドメインシフトに対処し、異なるシナリオにネットワークを適用することを可能にする。
近年,様々な画像daアプローチが提案されているが,ビデオdaに対する研究は限られている。
これは、時空間における画素の長期依存性として抽出された相関特徴を含む、ビデオの様々な特徴の適応の複雑さによるものである。
相関特性は行動クラスと高度に関連し,教師付き行動認識タスクによる正確な映像特徴抽出における効果を証明した。
しかし、同じアクションの相関特性はドメインシフトによってドメインによって異なる。
そこで本研究では,画素相関を調整して動作映像をアライメントする新しいadversarial correlation adaptation network (acan)を提案する。
ACANは、Pixel correlation Discrepancy (PCD)と呼ばれる相関情報の分布を最小限にすることを目的としている。
さらに、ビデオDA研究は、より大きなドメインシフトを持つクロスドメインビデオデータセットの欠如によって制限されている。
そこで我々は,ドメイン間の統計的な差が大きいことによるドメインシフトが大きいhmdb-aridデータセットを導入する。
このデータセットは、現在のデータセットをダークビデオ分類に活用するために構築されている。
実験により,既存のビデオDAデータセットと新しいビデオDAデータセットの両方に対して,提案したACANの最先端性能を示す。
関連論文リスト
- Learning multi-domain feature relation for visible and Long-wave
Infrared image patch matching [39.88037892637296]
我々は、VL-CMIMと呼ばれる最大の可視・長波長赤外線画像パッチマッチングデータセットを提示する。
さらに,マルチドメイン特徴関連学習ネットワーク(MD-FRN)を提案する。
論文 参考訳(メタデータ) (2023-08-09T11:23:32Z) - Exploring Few-Shot Adaptation for Activity Recognition on Diverse Domains [46.26074225989355]
ドメイン適応は、さまざまな環境における正確で堅牢なパフォーマンスを保証するために、アクティビティ認識に不可欠である。
本研究では,FewShot Domain Adaptation for Activity Recognition (FSDA-AR) に焦点をあてる。
より多様で困難な領域への適応を考慮した5つの確立されたデータセットを用いた新しいFSDA-ARを提案する。
論文 参考訳(メタデータ) (2023-05-15T08:01:05Z) - Unsupervised Video Domain Adaptation for Action Recognition: A
Disentanglement Perspective [37.45565756522847]
我々は2つの潜在要因からドメイン間ビデオを生成することを検討する。
TranSVAEフレームワークはそのような世代をモデル化するために開発される。
UCF-HMDB、Jester、Epic-Kitchensデータセットの実験は、TranSVAEの有効性と優位性を検証する。
論文 参考訳(メタデータ) (2022-08-15T17:59:31Z) - Error-Aware Spatial Ensembles for Video Frame Interpolation [50.63021118973639]
近年,ビデオフレーム(VFI)アルゴリズムは,データ駆動アルゴリズムと実装の両面で前例のない進歩により,大幅に改善されている。
近年の研究では、挑戦的なVFIシナリオに対処する手段として、高度な動き推定や新しいワープ手法が導入されている。
本研究は、光フローとIEの相関関係を詳細に検討することにより、中間フレームを異なるIEレベルに対応する異なる領域に分割する新しいエラー予測指標を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:15:38Z) - Learning Cross-modal Contrastive Features for Video Domain Adaptation [138.75196499580804]
本稿では、クロスモーダルとクロスドメインの特徴表現を同時に正規化する、ビデオドメイン適応のための統合フレームワークを提案する。
具体的には、ドメインの各モダリティを視点として扱い、コントラスト学習手法を適切に設計されたサンプリング戦略で活用する。
論文 参考訳(メタデータ) (2021-08-26T18:14:18Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Adapt Everywhere: Unsupervised Adaptation of Point-Clouds and Entropy
Minimisation for Multi-modal Cardiac Image Segmentation [10.417009344120917]
マルチモーダル心臓画像分割のための新しいUDA法を提案する。
提案手法は、逆学習に基づいて、異なる空間におけるソースとターゲットドメイン間のネットワーク特徴を適応する。
本手法はannotated source domainからunannotated target domainへの適応により2つの心データセットで検証した。
論文 参考訳(メタデータ) (2021-03-15T08:59:44Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z) - Learning to Combine: Knowledge Aggregation for Multi-Source Domain
Adaptation [56.694330303488435]
マルチソースドメイン適応(LtC-MSDA)フレームワークを併用する学習法を提案する。
簡単に言うと、知識グラフは様々なドメインのプロトタイプ上に構築され、セマンティックに隣接した表現間の情報伝達を実現する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-07-17T07:52:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。