論文の概要: Emotion Diffusion Classifier with Adaptive Margin Discrepancy Training for Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2603.29578v1
- Date: Tue, 31 Mar 2026 10:57:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.56695
- Title: Emotion Diffusion Classifier with Adaptive Margin Discrepancy Training for Facial Expression Recognition
- Title(参考訳): 表情認識のための適応的不一致訓練を用いた感情拡散分類器
- Authors: Rongkang Dong, Cuixin Yang, Cong Zhang, Yushen Zuo, Kin-Man Lam,
- Abstract要約: 顔表情認識(FER)は人間と機械の相互作用に不可欠である。
EmoDCは, 逆方向の強靭性を示す条件付き生成拡散モデルである。
EmoDCは、ノイズやぼやけに対する堅牢性の観点から、最先端の差別よりも優れています。
- 参考スコア(独自算出の注目度): 18.910203416173943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial Expression Recognition (FER) is essential for human-machine interaction, as it enables machines to interpret human emotions and internal states from facial affective behaviors. Although deep learning has significantly advanced FER performance, most existing deep-learning-based FER methods rely heavily on discriminative classifiers for fast predictions. These models tend to learn shortcuts and are vulnerable to even minor distribution shifts. To address this issue, we adopt a conditional generative diffusion model and introduce the Emotion Diffusion Classifier (EmoDC) for FER, which demonstrates enhanced adversarial robustness. However, retraining EmoDC using standard strategies fails to penalize incorrect categorical descriptions, leading to suboptimal recognition performance. To improve EmoDC, we propose margin-based discrepancy training, which encourages accurate predictions when conditioned on correct categorical descriptions and penalizes predictions conditioned on mismatched ones. This method enforces a minimum margin between noise-prediction errors for correct and incorrect categories, thereby enhancing the model's discriminative capability. Nevertheless, using a fixed margin fails to account for the varying difficulty of noise prediction across different images, limiting its effectiveness. To overcome this limitation, we propose Adaptive Margin Discrepancy Training (AMDiT), which dynamically adjusts the margin for each sample. Extensive experiments show that AMDiT significantly improves the accuracy of EmoDC over the Base model with standard denoising diffusion training on the RAF-DB basic subset, the RAF-DB compound subset, SFEW-2.0, and AffectNet, in 100-step evaluations. Additionally, EmoDC outperforms state-of-the-art discriminative classifiers in terms of robustness against noise and blur.
- Abstract(参考訳): 表情認識(FER)は、マシンが人間の感情や内部状態を顔の感情的行動から解釈できるため、人間と機械の相互作用に不可欠である。
ディープラーニングはFER性能を著しく向上させたが、既存の深層学習に基づくFER手法のほとんどは、高速な予測のために識別的分類器に大きく依存している。
これらのモデルはショートカットを学習する傾向があり、小さな分散シフトにも弱い。
この問題に対処するために、我々は条件付き生成拡散モデルを採用し、FERのための感情拡散分類器(EmoDC)を導入する。
しかし、標準的な戦略を用いてEmoDCを再訓練しても、誤ったカテゴリ記述をペナルティ化することができないため、準最適認識性能が得られる。
EMODCを改善するために,適切なカテゴリ記述を条件付けした場合に正確な予測を奨励し,ミスマッチした記述を条件付けした予測をペナルティ化する,マージンベースの不一致トレーニングを提案する。
本手法は, 正しいカテゴリーと誤カテゴリーの雑音予測誤差を最小限に抑え, モデルの識別能力を向上する。
それでも、固定マージンの使用は、異なる画像間でのノイズ予測の難しさを考慮せず、その効果を制限している。
この制限を克服するために,各サンプルのマージンを動的に調整する適応型マージン離散訓練(AMDiT)を提案する。
AMDiTは100段階評価において,RAF-DB基本サブセット,RAF-DB複合サブセット,SFEW-2.0,AffectNet上での標準偏差トレーニングにより,ベースモデルよりもEmoDCの精度を大幅に向上することを示した。
さらに、EmoDCは、ノイズやぼやけに対する堅牢性の観点から、最先端の識別的分類器よりも優れている。
関連論文リスト
- Adaptive Guidance for Retrieval-Augmented Masked Diffusion Models [60.25003813232697]
本稿では,Masked Diffusion Models (MDMs) のトレーニング自由適応ガイダンスフレームワークとして,適応検索型Masked Diffusion (ARAM) を提案する。
ARAMは、検索した文脈によって誘導される分布シフトのSNR(Signal-to-Noise Ratio)に従って、雑音発生時の誘導スケールを校正する。
複数の知識集約型QAベンチマークの実験は、ARAMが競争力のあるRAGベースラインよりも全体的なQA性能を改善することを示している。
論文 参考訳(メタデータ) (2026-03-18T12:54:50Z) - Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - Guiding Noisy Label Conditional Diffusion Models with Score-based Discriminator Correction [1.8434042562191815]
本稿では,Score-based Discriminator Correction(SBDC)について述べる。
提案手法は計算効率が良く, 推論時間を極端に増加させるだけであり, 再学習拡散モデルを必要としない。
論文 参考訳(メタデータ) (2025-08-27T05:29:07Z) - What is Adversarial Training for Diffusion Models? [4.71482540145286]
拡散モデル(DM)に対する対戦訓練(AT)は,分類器と根本的に異なることを示す。
ATは拡散流の滑らかさを強制し、異常値と破損したデータを改善する方法である。
我々は,低次元および高次元空間における既知の分布を持つ概念実証データセットを用いて,我々のアプローチを厳密に評価する。
論文 参考訳(メタデータ) (2025-05-27T20:32:28Z) - Scalable and Effective Negative Sample Generation for Hyperedge Prediction [55.9298019975967]
ハイパーエッジ予測は、Webベースのアプリケーションにおける複雑なマルチエンタリティ相互作用を理解するために不可欠である。
従来の手法では、正と負のインスタンスの不均衡により、高品質な負のサンプルを生成するのが困難であることが多い。
本稿では,これらの課題に対処するために拡散モデルを利用するハイパーエッジ予測(SEHP)フレームワークのスケーラブルで効果的な負のサンプル生成について述べる。
論文 参考訳(メタデータ) (2024-11-19T09:16:25Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Towards Robust and Interpretable EMG-based Hand Gesture Recognition using Deep Metric Meta Learning [37.21211404608413]
本稿では,意味的かつ解釈可能な表現の作成を監督するために,EMG PRにおける深層メートル法メタラーニングへのシフトを提案する。
我々は、不正確な決定をよりよく拒否する頑健なクラス近接性に基づく信頼度推定器を導出する。
論文 参考訳(メタデータ) (2024-04-17T23:37:50Z) - Soft ascent-descent as a stable and flexible alternative to flooding [6.527016551650139]
我々は,軟化・ポイントワイド機構であるSoftADを提案する。この機構は,降水量と降水量の影響を制限し,洪水の上昇・昇華効果を維持できる。
我々は,より小さな損失一般化ギャップとモデル規範を享受しながら,浸水と競合する分類精度をSoftADが実現できることを実証する。
論文 参考訳(メタデータ) (2023-10-16T02:02:56Z) - Toward Fair Facial Expression Recognition with Improved Distribution
Alignment [19.442685015494316]
本稿では,表情認識(FER)モデルにおけるバイアスを軽減する新しい手法を提案する。
本手法は、FERモデルによる埋め込みにおいて、性別、年齢、人種などの機密属性情報を低減することを目的としている。
ferモデルにおいて、魅力の概念を重要な感度属性として分析し、FERモデルがより魅力的な顔に対するバイアスを実際に示できることを実証する。
論文 参考訳(メタデータ) (2023-06-11T14:59:20Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。