論文の概要: Beyond Universality: The GCC-FER Dataset and Culture-Aware Adaptation for Dynamic Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2606.07063v1
- Date: Fri, 05 Jun 2026 09:03:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.653958
- Title: Beyond Universality: The GCC-FER Dataset and Culture-Aware Adaptation for Dynamic Facial Expression Recognition
- Title(参考訳): 普遍性を超えて: 動的顔表情認識のためのGCC-FERデータセットと文化認識適応
- Authors: Sonalika Singh, Jyotirindra Dandapat, Avishi Razdan, Kshipra V. Moghe, Puneet Gupta, Lalan Kumar,
- Abstract要約: 我々はGlobal Cross-Cultural Facial Expression Recognition (GCC-FER)と呼ばれるハイブリッド多文化ビデオデータセットを導入する。
GCC-FERは7つの基本表現にまたがる4つの文化グループにまたがる23,934のサンプルからなる。
カルチャー・アウェア FER (CA-FER) システムを提案する。
- 参考スコア(独自算出の注目度): 5.764381280944401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic Facial Expression Recognition (DFER) is a key enabling technology in affective computing, human-computer interaction, and intelligent multimedia systems. Despite the significant influence of cultural nuances on FER performance, most existing FER systems assume that emotional expressions are universally consistent across populations. This variation can be attributed to systematic differences in facial muscle activation patterns across cultures. A major challenge in advancing cross-cultural FER lies in the scarcity of culturally diverse benchmark datasets. To address this, a new hybrid multicultural video dataset termed Global Cross-Cultural Facial Expression Recognition (GCC-FER) is introduced. GCC-FER comprises 23,934 video samples spanning four cultural groups (African, Caucasian, East Asian, and South Asian) across seven basic expressions, combining psychologically supervised in-house data collection for underrepresented populations with rigorous ethnicity filtering of existing sources. To the best of our knowledge, GCC-FER is the first large-scale global cross-cultural DFER dataset designed to address these demographic gaps. Leveraging this dataset, behaviorally grounded cultural priors are derived for each cultural group and a global prior for practical deployment. A Culture-Aware FER (CA-FER) system is proposed to mitigate cultural bias by adaptively recalibrating latent facial representations. Extensive experiments on GCC-FER and DFEW demonstrate that the proposed system consistently improves FER performance across multicultural settings.
- Abstract(参考訳): 動的表情認識(Dynamic Facial Expression Recognition, DFER)は、感情コンピューティング、人間とコンピュータの相互作用、インテリジェントマルチメディアシステムにおいて重要な技術である。
FERのパフォーマンスに対する文化的ニュアンスの影響は大きいが、既存のFERシステムの多くは、感情表現は集団間で普遍的に一貫性があると考えている。
この変異は、培養物間での顔面筋の活性化パターンの系統的差異に起因する可能性がある。
異文化間のFERを進める上での大きな課題は、文化的に多様なベンチマークデータセットの不足にある。
これを解決するために、GCC-FER(Global Cross-Cultural Facial Expression Recognition)と呼ばれる新しいハイブリッド多文化ビデオデータセットが導入された。
GCC-FERは、4つの文化グループ(アフリカ、コーカサス、東アジア、南アジア)にまたがる23,934のサンプルを7つの基本表現で構成し、少数民族に対する心理的に監督された社内データ収集と、厳密な民族性のフィルタリングを組み合わせたものである。
我々の知る限り、GCC-FERは、これらの人口格差に対処するために設計された、最初の大規模なグローバルな文化横断型DFERデータセットである。
このデータセットを活用すれば、それぞれの文化グループと、実践的な展開のグローバルな事前に対して、行動的基盤を持つ文化的な事前が導出されます。
カルチャー・アウェア FER (CA-FER) システムを提案する。
GCC-FERとDFEWの大規模な実験により、提案システムは多文化的な環境におけるFER性能を一貫して改善することを示した。
関連論文リスト
- CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.130639734982395]
本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。
本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文 参考訳(メタデータ) (2025-06-10T17:16:23Z) - CulFiT: A Fine-grained Cultural-aware LLM Training Paradigm via Multilingual Critique Data Synthesis [41.261808170896686]
CulFiTは、多言語データと微粒な報酬モデリングを利用して、文化的感受性と傾きを高める新しいトレーニングパラダイムである。
本手法は,文化関連諸質問を合成し,文化関連言語における批判データを構築し,文化文献を検証可能な知識単位に分解するために,きめ細かい報酬を用いる。
論文 参考訳(メタデータ) (2025-05-26T04:08:26Z) - RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding [79.44246283490665]
本稿では,検索による視覚文化理解の促進を目的とした新しいベンチマークであるRAVENEAを紹介する。
RAVENEAは、文化中心の視覚的質問応答(cVQA)と文化インフォームドイメージキャプション(cIC)の2つのタスクに焦点を当てている。
画像クエリ毎に7つのマルチモーダルレトリバーを訓練・評価し、14の最先端の視覚言語モデルにおける検索強化入力の下流への影響を計測する。
論文 参考訳(メタデータ) (2025-05-20T14:57:16Z) - CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文 参考訳(メタデータ) (2025-04-09T13:40:13Z) - CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.452948673344395]
本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文 参考訳(メタデータ) (2024-05-24T01:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。