論文の概要: NeuroGaze-Distill: Brain-informed Distillation and Depression-Inspired Geometric Priors for Robust Facial Emotion Recognition
- arxiv url: http://arxiv.org/abs/2509.11916v1
- Date: Mon, 15 Sep 2025 13:33:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.311647
- Title: NeuroGaze-Distill: Brain-informed Distillation and Depression-Inspired Geometric Priors for Robust Facial Emotion Recognition
- Title(参考訳): NeuroGaze-Distill:脳インフォームド蒸留と抑うつにインスパイアされた幾何学的先駆者によるロバストな顔面表情認識
- Authors: Zilin Li, Weiwei Xu, Xuanqi Zhao, Yiran Zhu,
- Abstract要約: NeuroGaze-Distillは、脳にインフォームされた事前情報を画像のみのFER学生に転送するクロスモーダル蒸留フレームワークである。
DREAMERからEEG地形図を訓練した教師は、統合された5x5 V/Aプロトタイプグリッドを生成する。
この学生は、従来のCE/KDと2つの軽量正規化器でFERPlusを訓練している。
- 参考スコア(独自算出の注目度): 15.318171395502917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial emotion recognition (FER) models trained only on pixels often fail to generalize across datasets because facial appearance is an indirect and biased proxy for underlying affect. We present NeuroGaze-Distill, a cross-modal distillation framework that transfers brain-informed priors into an image-only FER student via static Valence/Arousal (V/A) prototypes and a depression-inspired geometric prior (D-Geo). A teacher trained on EEG topographic maps from DREAMER (with MAHNOB-HCI as unlabeled support) produces a consolidated 5x5 V/A prototype grid that is frozen and reused; no EEG-face pairing and no non-visual signals at deployment are required. The student (ResNet-18/50) is trained on FERPlus with conventional CE/KD and two lightweight regularizers: (i) Proto-KD (cosine) aligns student features to the static prototypes; (ii) D-Geo softly shapes the embedding geometry in line with affective findings often reported in depression research (e.g., anhedonia-like contraction in high-valence regions). We evaluate both within-domain (FERPlus validation) and cross-dataset protocols (AffectNet-mini; optional CK+), reporting standard 8-way scores alongside present-only Macro-F1 and balanced accuracy to fairly handle label-set mismatch. Ablations attribute consistent gains to prototypes and D-Geo, and favor 5x5 over denser grids for stability. The method is simple, deployable, and improves robustness without architectural complexity.
- Abstract(参考訳): 顔認識(FER)モデルは、顔の外観が影響の根底にある間接的かつ偏りのあるプロキシであるため、データセット全体での一般化に失敗することが多い。
本稿では, 画像のみのFER学生に, 静的Valence/Arousal (V/A) プロトタイプと, 抑うつにインスパイアされた幾何学的前駆体 (D-Geo) を用いて, クロスモーダル蒸留フレームワークであるNeuroGaze-Distillを提案する。
DREAMER(MAHNOB-HCIをラベルなしサポートとして含む)からEEG地形図を訓練した教師は、凍結・再利用された5x5 V/Aプロトタイプグリッドを生成し、EEG-faceペアリングは不要で、配備時に非視覚信号は不要である。
学生(ResNet-18/50)は、従来のCE/KDと2つの軽量正規化器でFERPlusで訓練されている。
(i)プロトKD(コサイン)は、学生の特徴を静的プロトタイプと整合させる。
(II)D-Geoは、うつ病研究でしばしば報告される情緒的な所見(例えば、高頻度領域におけるアンヘドニア様収縮)に沿って、埋め込み幾何学を柔らかく形成する。
提案手法は,内部ドメイン(FERPlusバリデーション)とクロスデータセットプロトコル(AffectNet-mini,Option CK+)の両方を評価し,標準8ウェイスコアを現在のみのMacro-F1と共に報告し,ラベルセットのミスマッチを適切に処理するためのバランスの取れた精度を評価する。
アブレーションはプロトタイプとD-Geoに一貫した利得があり、安定性のためにより高密度なグリッドよりも5x5が好ましい。
この方法はシンプルで、デプロイ可能で、アーキテクチャの複雑さなしに堅牢性を向上させる。
関連論文リスト
- BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [50.76802709706976]
異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
多様なデータソースを統一するために、脳の活動を離散表現に定量化する最初のトークンであるBrainTokenizerを紹介します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文 参考訳(メタデータ) (2025-05-18T14:07:14Z) - Uncertainty-Aware Label Refinement on Hypergraphs for Personalized Federated Facial Expression Recognition [58.98052764581606]
我々はhYpergraphs (AMY) 法に基づく新しい不確実性認識ラベルリファレントを開発する。
ローカルトレーニングでは、各ローカルモデルは、バックボーン、不確実性推定(UE)ブロック、および式分類(EC)ブロックで構成される。
次に、ローカルクライアントにおける標本の不確実性重みを推定するために、パーソナライズされた不確実性推定器を導入する。
論文 参考訳(メタデータ) (2025-01-03T13:59:21Z) - PL-DCP: A Pairwise Learning framework with Domain and Class Prototypes for EEG emotion recognition under unseen target conditions [27.769583873372518]
未確認対象条件下での脳波感情認識のためのドメインとカテゴリーのプロトタイプを用いたペアワイズ学習フレームワークを提案する。
PL-DCPモデルは、ソースデータとターゲットデータの両方を必要とするディープトランスファー学習法よりも若干性能が向上する。
この研究は感情認識のための効果的で堅牢な潜在的ソリューションを提供する。
論文 参考訳(メタデータ) (2024-11-27T00:56:43Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - EEGMatch: Learning with Incomplete Labels for Semi-Supervised EEG-based Cross-Subject Emotion Recognition [7.1695247553867345]
ラベル付き脳波データとラベルなし脳波データの両方を活用する新しい半教師付き学習フレームワーク(EEGMatch)を提案する。
2つのベンチマークデータベース(SEEDとSEED-IV)で大規模な実験を行う。
論文 参考訳(メタデータ) (2023-03-27T12:02:33Z) - PARSE: Pairwise Alignment of Representations in Semi-Supervised EEG
Learning for Emotion Recognition [23.40229188549055]
感情認識のための強い脳波表現を学習するための新しい半教師付きアーキテクチャであるPARSEを提案する。
大量のラベル付きデータと限られたラベル付きデータとの間の潜在的分布ミスマッチを低減するため、PARSEはペア方向のアライメントアライメントを使用する。
論文 参考訳(メタデータ) (2022-02-11T01:10:17Z) - Transformer-based Spatial-Temporal Feature Learning for EEG Decoding [4.8276709243429]
本稿では,主に注意機構に依存する新しい脳波復号法を提案する。
我々はより少ないパラメータで、脳波の多分類化における最先端のレベルに達しました。
脳-コンピュータインタフェース(BCI)の実用性を促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-06-11T00:48:18Z) - On the Equivalence of Decoupled Graph Convolution Network and Label
Propagation [60.34028546202372]
いくつかの研究は、カップリングがデカップリングよりも劣っていることを示している。
有効性にもかかわらず、疎結合GCNの作用機構はよく理解されていない。
本稿では,分離GCNの欠陥を克服する適応的学習法(PTA)を提案する。
論文 参考訳(メタデータ) (2020-10-23T13:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。