論文の概要: Unsupervised Domain Adaptation for Spatio-Temporal Action Localization
- arxiv url: http://arxiv.org/abs/2010.09211v1
- Date: Mon, 19 Oct 2020 04:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:58:25.848844
- Title: Unsupervised Domain Adaptation for Spatio-Temporal Action Localization
- Title(参考訳): 時空間行動局所化のための教師なしドメイン適応
- Authors: Nakul Agarwal, Yi-Ting Chen, Behzad Dariush, Ming-Hsuan Yang
- Abstract要約: S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
- 参考スコア(独自算出の注目度): 69.12982544509427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatio-temporal action localization is an important problem in computer
vision that involves detecting where and when activities occur, and therefore
requires modeling of both spatial and temporal features. This problem is
typically formulated in the context of supervised learning, where the learned
classifiers operate on the premise that both training and test data are sampled
from the same underlying distribution. However, this assumption does not hold
when there is a significant domain shift, leading to poor generalization
performance on the test data. To address this, we focus on the hard and novel
task of generalizing training models to test samples without access to any
labels from the latter for spatio-temporal action localization by proposing an
end-to-end unsupervised domain adaptation algorithm. We extend the
state-of-the-art object detection framework to localize and classify actions.
In order to minimize the domain shift, three domain adaptation modules at image
level (temporal and spatial) and instance level (temporal) are designed and
integrated. We design a new experimental setup and evaluate the proposed method
and different adaptation modules on the UCF-Sports, UCF-101 and JHMDB benchmark
datasets. We show that significant performance gain can be achieved when
spatial and temporal features are adapted separately, or jointly for the most
effective results.
- Abstract(参考訳): 時空間的行動ローカライゼーションはコンピュータビジョンにおける重要な問題であり、活動の場所と時期を検知するので、空間的特徴と時間的特徴の両方をモデル化する必要がある。
この問題は一般的に教師付き学習の文脈で定式化され、学習された分類器はトレーニングとテストの両方が同じ基盤となる分布からサンプリングされるという前提で動作する。
しかし、この仮定は、重要なドメインシフトがある場合には成り立たないため、テストデータに対する一般化性能は低下する。
そこで,本研究では,サンプルの時空間的動作のローカライゼーションのためのラベルにアクセスせずに,サンプルのトレーニングモデルを一般化する,エンドツーエンドの教師なしドメイン適応アルゴリズムを提案することで,その課題に焦点をあてる。
我々は,最先端オブジェクト検出フレームワークを拡張し,アクションのローカライズと分類を行う。
ドメインシフトを最小限にするために、画像レベル(時間的および空間的)とインスタンスレベル(時間的)の3つのドメイン適応モジュールを設計し統合する。
我々は,UCF-Sports,UCF-101,JHMDBベンチマークデータセット上で,提案手法と異なる適応モジュールを新たに設計し,評価する。
空間的特徴と時間的特徴を別々に適応させたり、最も効果的な結果を得るために共同で達成できることを示す。
関連論文リスト
- DATR: Unsupervised Domain Adaptive Detection Transformer with Dataset-Level Adaptation and Prototypical Alignment [7.768332621617199]
我々は、オブジェクト検出の教師なし領域適応のために、ドメイン適応検出TRansformer(DATR)と呼ばれる強力なDETRベースの検出器を導入する。
提案するDATRは,教師モデルによって生成された擬似ラベルを用いて,平均教師に基づく自己学習フレームワークを組み込んで,ドメインバイアスをさらに緩和する。
複数のドメイン適応シナリオにおいて,提案したDATRの性能と一般化性を示す実験を行った。
論文 参考訳(メタデータ) (2024-05-20T03:48:45Z) - STAT: Towards Generalizable Temporal Action Localization [56.634561073746056]
WTAL(Wakly-supervised temporal action Localization)は、ビデオレベルのラベルだけでアクションインスタンスを認識およびローカライズすることを目的としている。
既存の手法は、異なる分布に転送する際の重大な性能劣化に悩まされる。
本稿では,アクションローカライズ手法の一般化性向上に焦点を当てたGTALを提案する。
論文 参考訳(メタデータ) (2024-04-20T07:56:21Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Exploiting Domain Transferability for Collaborative Inter-level Domain
Adaptive Object Detection [17.61278045720336]
オブジェクト検出のためのドメイン適応(DAOD)は、アノテーションなしで対象オブジェクトを検出できるため、最近注目を集めている。
従来の研究は、2段階検出器の部分的なレベルから抽出した特徴を、対向訓練によって整列させることに重点を置いていた。
本稿では,マルチスケール対応不確実性注意(MUA),転送可能領域ネットワーク(TRPN),動的インスタンスサンプリング(DIS)の3つのコンポーネントを用いた提案手法を提案する。
論文 参考訳(メタデータ) (2022-07-20T01:50:26Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Self-supervised Autoregressive Domain Adaptation for Time Series Data [9.75443057146649]
教師なしドメイン適応(UDA)は、視覚アプリケーションにおけるドメインシフト問題にうまく対処している。
これらの手法は、以下の理由により時系列データのパフォーマンスが制限される可能性がある。
本稿では,これらの制約に対処するための自己監督型自己回帰ドメイン適応(SLARDA)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-29T08:17:23Z) - Dynamic Feature Alignment for Semi-supervised Domain Adaptation [23.67093835143]
本稿では,動的特徴アライメントを用いてドメイン間差とドメイン内差に対処することを提案する。
我々のアプローチは、広範囲なチューニングや逆行訓練を必要としないが、半教師付きドメイン適応のための技術の現状を著しく改善する。
論文 参考訳(メタデータ) (2021-10-18T22:26:27Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。