論文の概要: Disentangling Emotional Bases and Transient Fluctuations: A Low-Rank Sparse Decomposition Approach for Video Affective Analysis
- arxiv url: http://arxiv.org/abs/2511.11406v1
- Date: Fri, 14 Nov 2025 15:35:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.683748
- Title: Disentangling Emotional Bases and Transient Fluctuations: A Low-Rank Sparse Decomposition Approach for Video Affective Analysis
- Title(参考訳): 遠心性感情ベースと過渡ゆらぎ--映像影響分析のための低域スパース分解アプローチ
- Authors: Feng-Qi Cui, Jinyang Huang, Ziyu Jia, Xinyu Li, Xin Yan, Xiaokang Zhou, Meng Wang,
- Abstract要約: ビデオベースのAffective Computing(VAC)は、複雑な感情力学によるモデル不安定性と表現的劣化に悩まされている。
本稿では,LowRank Sparse Emotion Understanding Framework (LSEF)を提案する。
LSEFは3つのプラグ・アンド・プレイモジュールを用いており、このモジュールは階層的な低ランクスパース構成過程として感情力学を歪めている。
- 参考スコア(独自算出の注目度): 28.120677578256366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video-based Affective Computing (VAC), vital for emotion analysis and human-computer interaction, suffers from model instability and representational degradation due to complex emotional dynamics. Since the meaning of different emotional fluctuations may differ under different emotional contexts, the core limitation is the lack of a hierarchical structural mechanism to disentangle distinct affective components, i.e., emotional bases (the long-term emotional tone), and transient fluctuations (the short-term emotional fluctuations). To address this, we propose the Low-Rank Sparse Emotion Understanding Framework (LSEF), a unified model grounded in the Low-Rank Sparse Principle, which theoretically reframes affective dynamics as a hierarchical low-rank sparse compositional process. LSEF employs three plug-and-play modules, i.e., the Stability Encoding Module (SEM) captures low-rank emotional bases; the Dynamic Decoupling Module (DDM) isolates sparse transient signals; and the Consistency Integration Module (CIM) reconstructs multi-scale stability and reactivity coherence. This framework is optimized by a Rank Aware Optimization (RAO) strategy that adaptively balances gradient smoothness and sensitivity. Extensive experiments across multiple datasets confirm that LSEF significantly enhances robustness and dynamic discrimination, which further validates the effectiveness and generality of hierarchical low-rank sparse modeling for understanding affective dynamics.
- Abstract(参考訳): 感情分析や人間とコンピュータの相互作用に不可欠なビデオベースAffective Computing(VAC)は、複雑な感情力学によるモデル不安定性と表現的劣化に悩まされている。
異なる感情的ゆらぎの意味は異なる感情的文脈で異なる可能性があるため、中核的な制限は、感情的基盤(長期的感情的ゆらぎ)と過渡的ゆらぎ(短期的感情的ゆらぎ)を分離する階層的な構造的メカニズムの欠如である。
これを解決するために,Low-Rank Sparse Emotion Understanding Framework (LSEF) を提案する。
LSEFは3つのプラグ・アンド・プレイモジュール、すなわち、SEM(Stable Encoding Module)は低ランクな感情的基盤を捉え、DDM(Dynamic Decoupling Module)はスパースな過渡的な信号を分離し、CIM(Consistency Integration Module)はマルチスケールの安定性と反応性のコヒーレンスを再構築する。
このフレームワークは、勾配の滑らかさと感度を適応的にバランスするRanage Aware Optimization (RAO)戦略によって最適化されている。
複数のデータセットにわたる大規模な実験により、LSEFはロバスト性や動的識別を著しく向上させ、感情力学を理解するための階層的な低ランクスパースモデリングの有効性と一般性を検証する。
関連論文リスト
- Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Language Models [6.810484095299127]
感情支援は人間とAIの相互作用における中核的な能力であり、心理学的カウンセリング、ロールプレイ、コンパニオンシップなどの応用がある。
大規模言語モデル(LLM)の既存の評価は、しばしば短く静的な対話に依存し、感情的サポートの動的で長期的な性質を捉えない。
本フレームワークは,328の情緒的文脈と1,152の外乱イベントからなる大規模ベンチマークを構築し,進化する対話シナリオ下での現実的な情緒的変化をシミュレートする。
論文 参考訳(メタデータ) (2025-11-12T05:47:28Z) - Improving Multimodal Sentiment Analysis via Modality Optimization and Dynamic Primary Modality Selection [54.10252086842123]
マルチモーダル・センティメント・アナリティクス(MSA)は、ビデオにおける言語、音響、視覚データから感情を予測することを目的としている。
本稿では,モーダリティ最適化と動的一次モーダリティ選択フレームワーク(MODS)を提案する。
4つのベンチマークデータセットの実験では、MODSが最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2025-11-09T11:13:32Z) - Emotion-Coherent Reasoning for Multimodal LLMs via Emotional Rationale Verifier [53.55996102181836]
本稿では,感情関係検証器 (ERV) と説明リワードを提案する。
本手法は,対象感情と明確に一致した推論をモデルに導出する。
我々のアプローチは、説明と予測の整合性を高めるだけでなく、MLLMが感情的に一貫性があり、信頼できる対話を実現するのにも役立ちます。
論文 参考訳(メタデータ) (2025-10-27T16:40:17Z) - Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning [58.533203990515034]
ニューラルネットワークのスケーリングは機械学習における画期的な進歩をもたらしたが、このパラダイムは深層強化学習(DRL)では失敗している。
我々は、動的スパーストレーニング戦略が、アーキテクチャの改善によって確立された主要なスケーラビリティ基盤を補完するモジュール固有の利点を提供することを示す。
アーキテクチャ改善の利点を生かした実践的なフレームワークであるModule-Specific Training (MST) にこれらの知見を精査し、アルゴリズムの修正なしに様々なRLアルゴリズムをまたいだ大幅なスケーラビリティ向上を示す。
論文 参考訳(メタデータ) (2025-10-14T03:03:08Z) - Multi-Modal Sentiment Analysis with Dynamic Attention Fusion [0.0]
本稿では,事前学習した言語モデルからの凍結したテキスト埋め込みと音声エンコーダの音響的特徴を組み合わせた軽量フレームワークである動的注意融合(DAF)を紹介する。
提案するDAFモデルは,大規模なマルチモーダルベンチマークにおいて,静的核融合と非モードベースラインの両方を一貫して上回っている。
言語情報と非言語情報を効果的に統合することにより、我々のアプローチは感情予測のためのより堅牢な基盤を提供する。
論文 参考訳(メタデータ) (2025-09-25T09:54:04Z) - Technical Approach for the EMI Challenge in the 8th Affective Behavior Analysis in-the-Wild Competition [10.741278852581646]
Emotional Mimicry Intensity (EMI)の推定は、人間の社会的行動を理解し、人間とコンピュータの相互作用を促進する上で重要な役割を担っている。
本稿では,既存手法の限界に対処する2段階のクロスモーダルアライメントフレームワークを提案する。
Hume-Vidmimic2データセットの実験では、6つの感情次元の平均ピアソン係数相関が0.51であるのに対し、優れた性能を示した。
論文 参考訳(メタデータ) (2025-03-13T17:46:16Z) - Rank-O-ToM: Unlocking Emotional Nuance Ranking to Enhance Affective Theory-of-Mind [7.098576908286076]
心の理論のための感情的ニュアンス(Rank-O-ToM)のランク付け(Rank-O-ToM)は、信頼度レベルを感情スペクトルと整合させるための順序的ランク付けを利用するフレームワークである。
Rank-O-ToMは感情のニュアンスな理解を強化し、感情的状態を推論するAIの能力を向上させる。
論文 参考訳(メタデータ) (2025-02-24T05:04:40Z) - A Hierarchical Regression Chain Framework for Affective Vocal Burst
Recognition [72.36055502078193]
本稿では,声帯からの感情認識のための連鎖回帰モデルに基づく階層的枠組みを提案する。
データスパシティの課題に対処するため、レイヤワイドおよび時間アグリゲーションモジュールを備えた自己教師付き学習(SSL)表現も使用しています。
提案されたシステムは、ACII Affective Vocal Burst (A-VB) Challenge 2022に参加し、「TWO」および「CULTURE」タスクで第1位となった。
論文 参考訳(メタデータ) (2023-03-14T16:08:45Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。