論文の概要: Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method
- arxiv url: http://arxiv.org/abs/2508.09202v2
- Date: Thu, 14 Aug 2025 14:05:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 13:42:23.657418
- Title: Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method
- Title(参考訳): 表現認識のためのパーソナライズされた特徴変換:効率的なソース自由領域適応法
- Authors: Masoumeh Sharafi, Soufiane Belharbi, Houssem Ben Salem, Ali Etemad, Alessandro Lameiras Koerich, Marco Pedersoli, Simon Bacon, Eric Granger,
- Abstract要約: 表情認識(FER)モデルは、ヒューマンコンピュータのインタラクションや医療モニタリングなど、多くのビデオベースの感情コンピューティングアプリケーションで採用されている。
ディープFERモデルは、しばしば微妙な表現と高いオブジェクト間の変動に悩まされ、現実世界のアプリケーションでの性能を制限します。
本稿では、ソースデータが適応できない難題に対処し、中性表現のみからなるラベル付きターゲットデータのみを利用可能とする。
潜在空間を翻訳することで、PFTは表情生成の複雑さやノイズを回避し、分類に最適化された識別的埋め込みを生成する。
- 参考スコア(独自算出の注目度): 64.05966759056122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial expression recognition (FER) models are employed in many video-based affective computing applications, such as human-computer interaction and healthcare monitoring. However, deep FER models often struggle with subtle expressions and high inter-subject variability, limiting their performance in real-world applications. To improve their performance, source-free domain adaptation (SFDA) methods have been proposed to personalize a pretrained source model using only unlabeled target domain data, thereby avoiding data privacy, storage, and transmission constraints. This paper addresses a challenging scenario where source data is unavailable for adaptation, and only unlabeled target data consisting solely of neutral expressions is available. SFDA methods are not typically designed to adapt using target data from only a single class. Further, using models to generate facial images with non-neutral expressions can be unstable and computationally intensive. In this paper, personalized feature translation (PFT) is proposed for SFDA. Unlike current image translation methods for SFDA, our lightweight method operates in the latent space. We first pre-train the translator on the source domain data to transform the subject-specific style features from one source subject into another. Expression information is preserved by optimizing a combination of expression consistency and style-aware objectives. Then, the translator is adapted on neutral target data, without using source data or image synthesis. By translating in the latent space, PFT avoids the complexity and noise of face expression generation, producing discriminative embeddings optimized for classification. Using PFT eliminates the need for image synthesis, reduces computational overhead (using a lightweight translator), and only adapts part of the model, making the method efficient compared to image-based translation.
- Abstract(参考訳): 表情認識(FER)モデルは、ヒューマンコンピュータのインタラクションや医療モニタリングなど、多くのビデオベースの感情コンピューティングアプリケーションで採用されている。
しかし、ディープFERモデルは微妙な表現と高いオブジェクト間の変動に悩まされ、現実世界のアプリケーションでは性能が制限される。
その性能を改善するために、未ラベルのターゲットドメインデータのみを使用して事前訓練されたソースモデルをパーソナライズし、データプライバシ、ストレージ、送信制約を回避するために、ソースフリードメイン適応(SFDA)手法が提案されている。
本論文は, ソースデータが適応できない, 中立表現のみからなるラベル付きターゲットデータのみを利用できる, という難題に対処する。
SFDA法は通常、1つのクラスのみのターゲットデータを使用して適応するように設計されていない。
さらに、非ニュートラル表現を用いた顔画像生成モデルを使用することで、不安定で計算集約的な画像生成が可能となる。
本稿では,FDAに対してパーソナライズされた特徴翻訳(PFT)を提案する。
SFDAの現在の画像翻訳方法とは異なり、我々の軽量な方法は潜伏空間で機能する。
まず、まず、ソースドメインデータ上のトランスレータを事前訓練し、サブジェクト固有のスタイルの特徴を、あるソースのサブジェクトから別のソースへ変換する。
表現一貫性とスタイル認識目的の組合せを最適化することにより、表現情報を保存する。
そして、ソースデータや画像合成を使わずに、中立目標データに翻訳装置を適応させる。
潜在空間を翻訳することで、PFTは表情生成の複雑さやノイズを回避し、分類に最適化された識別的埋め込みを生成する。
PFTを使用することで、画像合成の必要性を排除し、計算オーバーヘッドを低減し(軽量トランスレータを使用して)、モデルの一部にのみ適応し、画像ベースの翻訳に比べて効率が良い。
関連論文リスト
- Zero Shot Domain Adaptive Semantic Segmentation by Synthetic Data Generation and Progressive Adaptation [8.124539956043074]
本稿では,ゼロショット領域適応型セマンティックセマンティックセグメンテーションに挑戦する新たな手法を提案する。
トレーニング済みオフザシェルフテキスト・ツー・イメージ拡散モデルを用いて,ソース・ドメイン・イメージをターゲット・スタイルに転送することでトレーニング・イメージを生成する。
合成データにおけるノイズの影響を軽減するため,我々は,学習過程を通じて堅牢な学習を確実にする,進行的適応戦略を設計する。
論文 参考訳(メタデータ) (2025-08-05T10:21:09Z) - Disentangled Source-Free Personalization for Facial Expression Recognition with Neutral Target Data [49.25159192831934]
本稿では,対象表現データがないモデルに適応することで生じる課題に対処するため,Distangled SFDA法を提案する。
本手法は,対象対象者に対する非ニュートラルな表現データを生成しながら,表現と同一性に関連する特徴を解き放つことを学習する。
論文 参考訳(メタデータ) (2025-03-26T17:53:53Z) - PrivImage: Differentially Private Synthetic Image Generation using Diffusion Models with Semantic-Aware Pretraining [13.823621924706348]
差分プライバシー(DP)画像データ合成により、企業はプライバシの懸念なしに合成画像を共有し、利用することができる。
従来の手法では、生成モデルの高度な技術と、公開データセットでの事前学習を取り入れて、例外的なDP画像データを生成する。
本稿では,事前学習データを慎重に選択する新しいDP画像合成手法PRIVIMAGEを提案する。
論文 参考訳(メタデータ) (2023-10-19T14:04:53Z) - Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations [61.132408427908175]
0ショットのGAN適応は、よく訓練されたジェネレータを再利用して、目に見えないターゲットドメインの画像を合成することを目的としている。
実際の画像の代わりに1つの代表的テキスト機能しか持たないため、合成された画像は徐々に多様性を損なう。
そこで本研究では,CLIP空間における対象テキストの意味的変化を見つけるための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T08:12:28Z) - SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with
Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。
本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文 参考訳(メタデータ) (2023-06-07T12:34:55Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Consistency Regularization with High-dimensional Non-adversarial
Source-guided Perturbation for Unsupervised Domain Adaptation in Segmentation [15.428323201750144]
BiSIDAは、未ラベルのターゲットデータセットからの情報を効率的に活用するために、一貫性の正則化を採用している。
BiSIDAは、一般的に使われている2つの合成-実領域適応ベンチマーク上で、新しい最先端を実現する。
論文 参考訳(メタデータ) (2020-09-18T03:26:44Z) - Source Free Domain Adaptation with Image Translation [33.46614159616359]
大規模なデータセットをリリースする努力は、プライバシと知的財産権の考慮によって損なわれる可能性がある。
実現可能な代替手段は、代わりに事前訓練されたモデルをリリースすることである。
本稿では,対象画像のスタイルを未知のソース画像に変換する画像翻訳手法を提案する。
論文 参考訳(メタデータ) (2020-08-17T17:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。