Fugu-MT 論文翻訳(概要): Learning Domain-Invariant Temporal Dynamics for Few-Shot Action Recognition

論文の概要: Learning Domain-Invariant Temporal Dynamics for Few-Shot Action Recognition

arxiv url: http://arxiv.org/abs/2402.12706v1
Date: Tue, 20 Feb 2024 04:09:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 17:10:12.051693
Title: Learning Domain-Invariant Temporal Dynamics for Few-Shot Action Recognition
Title（参考訳）: Few-Shot行動認識のためのドメイン不変時間ダイナミクスの学習
Authors: Yuke Li, Guangyi Chen, Ben Abramowitz, Stefano Anzellott, Donglai Wei
Abstract要約: 少ないショットアクション認識は、トレーニング済みのモデルを新しいデータに迅速に適応することを目的としている。主な課題は、事前訓練されたモデルから学んだ伝達可能な知識の特定と活用である。
参考スコア（独自算出の注目度）: 13.434821382278264
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Few-shot action recognition aims at quickly adapting a pre-trained model to the novel data with a distribution shift using only a limited number of samples. Key challenges include how to identify and leverage the transferable knowledge learned by the pre-trained model. Our central hypothesis is that temporal invariance in the dynamic system between latent variables lends itself to transferability (domain-invariance). We therefore propose DITeD, or Domain-Invariant Temporal Dynamics for knowledge transfer. To detect the temporal invariance part, we propose a generative framework with a two-stage training strategy during pre-training. Specifically, we explicitly model invariant dynamics including temporal dynamic generation and transitions, and the variant visual and domain encoders. Then we pre-train the model with the self-supervised signals to learn the representation. After that, we fix the whole representation model and tune the classifier. During adaptation, we fix the transferable temporal dynamics and update the image encoder. The efficacy of our approach is revealed by the superior accuracy of DITeD over leading alternatives across standard few-shot action recognition datasets. Moreover, we validate that the learned temporal dynamic transition and temporal dynamic generation modules possess transferable qualities.
Abstract（参考訳）: 少数のアクション認識は、限られたサンプル数だけを用いて、分散シフトで、事前訓練されたモデルを新しいデータに迅速に適応することを目的としている。主な課題は、事前訓練されたモデルから学んだ伝達可能な知識の特定と活用である。我々の中心となる仮説は、潜在変数間の力学系の時間的不変性が伝達可能性(ドメイン不変性)に寄与するということである。そこで,我々は知識伝達の領域不変時間ダイナミクスを提案する。時間的不変部分を検出するために,事前学習中に2段階のトレーニング戦略を持つ生成フレームワークを提案する。具体的には、時間的動的生成や遷移を含む不変ダイナミクスと、視覚およびドメインエンコーダを明示的にモデル化する。次に、自己教師付き信号でモデルを事前訓練し、表現を学習する。その後、表現モデル全体を修正し、分類器をチューニングします。適応中は、転送可能な時間ダイナミクスを修正し、画像エンコーダを更新する。提案手法の有効性は,標準的な数発のアクション認識データセットよりもDITeDの方が優れた精度で明らかである。さらに、学習した時間的動的遷移と時間的動的生成モジュールが伝達可能な性質を持つことを検証する。

関連論文リスト

Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence [60.37934652213881]
ドメイン適応(DA)は、ソースドメインから関連するターゲットドメインへの知識伝達を容易にする。本稿では、ソースデータフリーなアクティブドメイン適応(SFADA)という実用的なDAパラダイムについて検討する。本稿では,学習者学習(LFTL)というSFADAの新たなパラダイムを紹介し,学習した学習知識を事前学習モデルから活用し,余分なオーバーヘッドを伴わずにモデルを積極的に反復する。
論文参考訳（メタデータ） (2024-07-26T17:51:58Z)
Learning Transferable Conceptual Prototypes for Interpretable Unsupervised Domain Adaptation [79.22678026708134]
本稿では,Transferable Prototype Learning (TCPL) という,本質的に解釈可能な手法を提案する。この目的を達成するために、ソースドメインからターゲットドメインにカテゴリの基本概念を転送する階層的なプロトタイプモジュールを設計し、基礎となる推論プロセスを説明するためにドメイン共有プロトタイプを学習する。総合的な実験により,提案手法は有効かつ直感的な説明を提供するだけでなく,従来の最先端技術よりも優れていることが示された。
論文参考訳（メタデータ） (2023-10-12T06:36:41Z)
ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation [48.039156140237615]
目標ドメインの継続的な変更に事前訓練されたモデルを適用するために、連続的なテスト時間適応タスクを提案する。我々はCTTA用のVisual Domain Adapter (ViDA) を設計し、ドメイン固有知識とドメイン共有知識の両方を明示的に扱う。提案手法は,CTTAタスクの分類とセグメント化の両方において,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-06-07T11:18:53Z)
Visualizing Transferred Knowledge: An Interpretive Model of Unsupervised Domain Adaptation [70.85686267987744]
教師なしのドメイン適応問題は、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することができる。本稿では、翻訳された知識の謎を視覚的に明らかにする最初の試みとして、教師なしドメイン適応の解釈モデルを提案する。提案手法は,ベースモデルの予測を直感的に説明し,画像パッチをソースドメインとターゲットドメインの両方で同一のセマンティクスとマッチングすることで伝達知識を公開する。
論文参考訳（メタデータ） (2023-03-04T03:02:12Z)
Decorate the Newcomers: Visual Domain Prompt for Continual Test Time Adaptation [14.473807945791132]
Continual Test-Time Adaptation (CTTA) は、ソースデータにアクセスすることなく、ラベルなしのターゲットドメインを継続的に変更することを目的としている。そこで本論文では,NLPにおける素早い学習によって動機づけられた画像レベルの視覚領域プロンプトを,ソースモデルパラメータを凍結させながら学習することを提案する。
論文参考訳（メタデータ） (2022-12-08T08:56:02Z)
Consecutive Pretraining: A Knowledge Transfer Learning Strategy with Relevant Unlabeled Data for Remote Sensing Domain [25.84756140221655]
自然言語処理(NLP)における事前学習を停止しないという考え方に基づいて,CSPT(ConSecutive PreTraining)を提案する。提案したCSPTは、タスク対応モデルトレーニングのためのラベルなしデータの巨大な可能性を公開することもできる。その結果,提案したCSPTをタスク認識モデルトレーニングに活用することにより,従来の教師付きプレトレーニング-then-fine-tuning法よりもRTDのダウンストリームタスクのほとんどを上回り得ることがわかった。
論文参考訳（メタデータ） (2022-07-08T12:32:09Z)
Variational Transfer Learning using Cross-Domain Latent Modulation [1.9662978733004601]
本稿では,効率的な転送学習を実現するために,新しいドメイン間遅延変調機構を変分オートエンコーダフレームワークに導入する。ソース領域とターゲット領域の深部表現は、まず統一推論モデルにより抽出され、勾配逆数を用いて整列される。学習した深層表現は、一貫性の制約が適用される代替ドメインの潜在エンコーディングにクロスモデレートされる。
論文参考訳（メタデータ） (2022-05-31T03:47:08Z)
Adversarially-Trained Deep Nets Transfer Better: Illustration on Image Classification [53.735029033681435]
トランスファーラーニングは、訓練済みのディープニューラルネットワークを画像認識タスクに新しいドメインに適用するための強力な方法論である。本研究では,非逆学習モデルよりも逆学習モデルの方が優れていることを示す。
論文参考訳（メタデータ） (2020-07-11T22:48:42Z)
Off-Dynamics Reinforcement Learning: Training for Transfer with Domain Classifiers [138.68213707587822]
強化学習におけるドメイン適応のためのシンプルで実践的で直感的なアプローチを提案する。報酬関数を変更することで、力学の違いを補うことで、この目標を達成することができることを示す。我々のアプローチは、連続状態とアクションを持つドメインに適用でき、ダイナミックスの明示的なモデルを学ぶ必要がない。
論文参考訳（メタデータ） (2020-06-24T17:47:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。