論文の概要: Weakly Supervised Continuous Micro-Expression Intensity Estimation Using Temporal Deep Neural Network
- arxiv url: http://arxiv.org/abs/2512.01145v1
- Date: Sun, 30 Nov 2025 23:47:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.60187
- Title: Weakly Supervised Continuous Micro-Expression Intensity Estimation Using Temporal Deep Neural Network
- Title(参考訳): 時間的深部ニューラルネットワークを用いた微視的連続圧縮強度推定
- Authors: Riyadh Mohammed Almushrafy,
- Abstract要約: 弱い時間ラベルのみを用いた連続的マイクロ圧縮強度推定のための統一的なフレームワークを提案する。
単純な三角形の先行は、スパース時間的ランドマークを密度の高い擬似強度軌跡に変換する。
SAMMとCASME IIの実験は擬似強度軌道と強い時間的一致を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-facial expressions are brief and involuntary facial movements that reflect genuine emotional states. While most prior work focuses on classifying discrete micro-expression categories, far fewer studies address the continuous evolution of intensity over time. Progress in this direction is limited by the lack of frame-level intensity labels, which makes fully supervised regression impractical. We propose a unified framework for continuous micro-expression intensity estimation using only weak temporal labels (onset, apex, offset). A simple triangular prior converts sparse temporal landmarks into dense pseudo-intensity trajectories, and a lightweight temporal regression model that combines a ResNet18 encoder with a bidirectional GRU predicts frame-wise intensity directly from image sequences. The method requires no frame-level annotation effort and is applied consistently across datasets through a single preprocessing and temporal alignment pipeline. Experiments on SAMM and CASME II show strong temporal agreement with the pseudo-intensity trajectories. On SAMM, the model reaches a Spearman correlation of 0.9014 and a Kendall correlation of 0.7999, outperforming a frame-wise baseline. On CASME II, it achieves up to 0.9116 and 0.8168, respectively, when trained without the apex-ranking term. Ablation studies confirm that temporal modeling and structured pseudo labels are central to capturing the rise-apex-fall dynamics of micro-facial movements. To our knowledge, this is the first unified approach for continuous micro-expression intensity estimation using only sparse temporal annotations.
- Abstract(参考訳): マイクロ・フェイス・表情(Micro-face Expression)は、感情状態を反映する、簡潔で不随意的な顔の動きである。
これまでのほとんどの研究は、離散的なマイクロ圧縮カテゴリの分類に重点を置いていたが、時間の経過とともに強度の連続的な進化に対処する研究は、はるかに少ない。
この方向の進行はフレームレベルの強度ラベルの欠如によって制限される。
弱い時間ラベル(オンセット,頂点,オフセット)のみを用いた連続的マイクロ圧縮強度推定のための統一的なフレームワークを提案する。
単純な三角形事前は、スパース時間ランドマークを密度の高い擬似強度軌跡に変換するとともに、ResNet18エンコーダと双方向GRUを組み合わせた軽量時間回帰モデルにより、画像シーケンスから直接フレームワイドインテンシティを予測する。
この方法はフレームレベルのアノテーションの労力を必要とせず、単一の前処理と時間的アライメントパイプラインを通じてデータセットに一貫して適用される。
SAMMとCASME IIの実験は擬似強度軌道と強い時間的一致を示した。
SAMMでは、モデルのスピアマン相関は0.9014、ケンドール相関は0.7999に達し、フレームワイドベースラインを上回っている。
CASME IIでは、それぞれ0.9116と0.8168に達する。
アブレーション研究は、時間的モデリングと構造化された擬似ラベルが、微小な顔の動きの上昇と降着のダイナミクスを捉える中心であることを確認した。
我々の知る限り、これはスパース時間アノテーションのみを用いた連続的マイクロ圧縮強度推定のための最初の統一的アプローチである。
関連論文リスト
- EDIT: Early Diffusion Inference Termination for dLLMs Based on Dynamics of Training Gradients [6.736735746633275]
拡散に基づく大規模言語モデル (dLLMs) は反復的妄想を通じてトークン生成を洗練させるが、全てのステップが完了する前に答えは安定することが多い。
本稿では,トレーニング時推論に対する十分な推論安定性が検出された場合に,適応的にデノイングを停止する推論時基準であるEDITを提案する。
論文 参考訳(メタデータ) (2025-11-29T23:47:47Z) - Point-Supervised Facial Expression Spotting with Gaussian-Based Instance-Adaptive Intensity Modeling [18.418576406317538]
P-FES (point-supervised facial expression spotting) のための2分岐フレームワークを提案する。
まず、ハード擬似ラベルの制限を軽減するために、ガウス型インスタンス適応強度モデリング(GIM)モジュールを提案する。
第2に,擬似アペックスフレームのみに基づいて,マクロ表現とマイクロ表現を区別するクラス認識の頂点分類分岐を設計する。
論文 参考訳(メタデータ) (2025-11-21T04:59:54Z) - Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models [57.474294329887236]
拡散大言語モデル (dLLMs) は反復的 denoising を通じてテキストを生成する。
現在のデコード戦略は、最終的な出力に有利なリッチな中間予測を捨てている。
時間的整合性を利用する2つの相補的手法を導入する。
論文 参考訳(メタデータ) (2025-08-12T17:59:57Z) - Intensity Profile Projection: A Framework for Continuous-Time
Representation Learning for Dynamic Networks [50.2033914945157]
本稿では、連続時間動的ネットワークデータのための表現学習フレームワークIntensity Profile Projectionを提案する。
このフレームワークは3つの段階から構成される: 対の強度関数を推定し、強度再構成誤差の概念を最小化する射影を学習する。
さらに、推定軌跡の誤差を厳密に制御する推定理論を開発し、その表現がノイズに敏感な追従解析に利用できることを示す。
論文 参考訳(メタデータ) (2023-06-09T15:38:25Z) - RCL: Recurrent Continuous Localization for Temporal Action Detection [33.05225035315206]
最先端の手法は主に密度の高いアンカー方式に依存しており、アンカーは離散化されたグリッドを持つ時間領域上で一様にサンプリングされる。
本稿では、完全連続的アンカー表現を学習するRCL(Recurrent Continuous Localization)を紹介する。
RCLはTHUMOS14では52.92% mAP@0.5、ActivtiyNet v1.3では37.65% mAPを達成する。
論文 参考訳(メタデータ) (2022-03-14T13:56:12Z) - Short and Long Range Relation Based Spatio-Temporal Transformer for
Micro-Expression Recognition [61.374467942519374]
我々は,マイクロ圧縮認識のための最初の純粋トランスフォーマーベースアプローチである,新しいアテンポ的トランスフォーマーアーキテクチャを提案する。
空間パターンを学習する空間エンコーダと、時間的分析のための時間的次元分類と、ヘッドとを備える。
広範に使用されている3つの自発的マイクロ圧縮データセットに対する総合的な評価は,提案手法が一貫して芸術の状態を上回っていることを示している。
論文 参考訳(メタデータ) (2021-12-10T22:10:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。