論文の概要: Rethinking Key-frame-based Micro-expression Recognition: A Robust and Accurate Framework Against Key-frame Errors
- arxiv url: http://arxiv.org/abs/2508.06640v1
- Date: Fri, 08 Aug 2025 18:40:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.485352
- Title: Rethinking Key-frame-based Micro-expression Recognition: A Robust and Accurate Framework Against Key-frame Errors
- Title(参考訳): キーフレームに基づくマイクロ圧縮認識の再考:キーフレームエラーに対するロバストで高精度なフレームワーク
- Authors: Zheyuan Zhang, Weihao Tang, Hong Chen,
- Abstract要約: CausalNetはキーフレームインデックスエラーに直面する堅牢なマイクロ圧縮認識(MER)を実現するための新しいフレームワークである。
CausalNetはいくつかの標準MERベンチマークで最先端(SOTA)メソッドを上回っている。
- 参考スコア(独自算出の注目度): 8.492254548782121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Micro-expression recognition (MER) is a highly challenging task in affective computing. With the reduced-sized micro-expression (ME) input that contains key information based on key-frame indexes, key-frame-based methods have significantly improved the performance of MER. However, most of these methods focus on improving the performance with relatively accurate key-frame indexes, while ignoring the difficulty of obtaining accurate key-frame indexes and the objective existence of key-frame index errors, which impedes them from moving towards practical applications. In this paper, we propose CausalNet, a novel framework to achieve robust MER facing key-frame index errors while maintaining accurate recognition. To enhance robustness, CausalNet takes the representation of the entire ME sequence as the input. To address the information redundancy brought by the complete ME range input and maintain accurate recognition, first, the Causal Motion Position Learning Module (CMPLM) is proposed to help the model locate the muscle movement areas related to Action Units (AUs), thereby reducing the attention to other redundant areas. Second, the Causal Attention Block (CAB) is proposed to deeply learn the causal relationships between the muscle contraction and relaxation movements in MEs. Empirical experiments have demonstrated that on popular ME benchmarks, the CausalNet has achieved robust MER under different levels of key-frame index noise. Meanwhile, it has surpassed state-of-the-art (SOTA) methods on several standard MER benchmarks when using the provided annotated key-frames. Code is available at https://github.com/tony19980810/CausalNet.
- Abstract(参考訳): マイクロ圧縮認識(MER)は、感情コンピューティングにおいて非常に難しい課題である。
キーフレームインデックスに基づくキー情報を含む最小サイズマイクロ圧縮(ME)入力により、キーフレームベースの手法はMERの性能を大幅に改善した。
しかし、これらの手法の多くは、キーフレームインデックスを正確に取得することの難しさや、キーフレームインデックスエラーの客観的な存在を無視しながら、比較的正確なキーフレームインデックスによるパフォーマンス向上に重点を置いている。
本稿では,キーフレームのインデックスエラーに直面するロバストなMERを実現するための新しいフレームワークCausalNetを提案する。
堅牢性を高めるため、CausalNetはMEシーケンス全体を入力として表現する。
完全なME範囲入力による情報冗長性に対処し、正確な認識を維持するために、まず、モデルがアクションユニット(AUs)に関連する筋肉の動き領域を見つけるのを助けるために、CMPLM(Causal Motion Position Learning Module)を提案する。
第2に,CAB(Causal Attention Block)が提案され,MEsにおける筋収縮と緩和運動の因果関係を深く理解している。
実証実験により、人気のあるMEベンチマークでは、CausalNetはキーフレームのインデックスノイズの異なるレベルにおいて堅牢なMERを達成した。
一方、提供されている注釈付きキーフレームを使用する場合、いくつかの標準MERベンチマークで最先端(SOTA)メソッドを上回っている。
コードはhttps://github.com/tony19980810/CausalNetで入手できる。
関連論文リスト
- Causal-Aware Intelligent QoE Optimization for VR Interaction with Adaptive Keyframe Extraction [6.2819120598047]
本稿では,VRゲームにおけるクオリティ・オブ・エクスペリエンス(QoE)を最大化するインテリジェントなフレームワークを提案する。
適応抽出と因果認識強化学習(RL)の統合
実験の結果、我々のフレームワークは対話的なレイテンシを著しく低減し、QoEを強化し、公平性を維持することがわかった。
論文 参考訳(メタデータ) (2025-06-24T07:32:34Z) - Adaptive Keyframe Sampling for Long Video Understanding [75.7837692594814]
本稿では、適応鍵フレームサンプリング(AKS)という、単純だが効果的なアルゴリズムを提案する。
これはAdaptive Keyframe Sampling (AKS)と呼ばれるプラグインとプレイモジュールを挿入し、ビデオトークンの固定数で有用な情報を最大化することを目的としている。
2つの長いビデオ理解ベンチマークの実験は、AKSが情報的出会いを選択する際にビデオQA精度を改善することを検証する。
論文 参考訳(メタデータ) (2025-02-28T17:46:29Z) - Keys to Robust Edits: from Theoretical Insights to Practical Advances [20.10464264597003]
大規模言語モデル(LLM)は、矛盾/時代遅れのパラメトリック記憶のために正確な知識を維持するのに苦労する。
当社のソリューションでは,ネイティブモデル表現から編集キーをアンタングルするプラグイン・アンド・プレイモジュールである textitRobust Edit Pathway (REP) を導入しています。
論文 参考訳(メタデータ) (2024-10-12T02:54:12Z) - Solving Short-Term Relocalization Problems In Monocular Keyframe Visual SLAM Using Spatial And Semantic Data [1.2937020918620652]
本稿では,単眼カメラシステムを用いた移動ロボットのロバストな短期的再ローカライズ機能の開発に焦点をあてる。
環境中で検出されたオブジェクトのセマンティック情報を含む、新しいマルチモーダルディスクリプタが導入された。
この記述子を用いて,マルチステージフィルタリングアルゴリズムとして定式化された新しいキーフレームベースのPlace Recognition (KPR)法を提案する。
論文 参考訳(メタデータ) (2024-07-28T15:54:37Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Can SAM Boost Video Super-Resolution? [78.29033914169025]
単純な有効モジュールであるSAM-guidEd refinEment Module (SEEM)を提案する。
この軽量プラグインモジュールは、セマンティック・アウェア機能の生成にアテンションメカニズムを活用するように設計されている。
我々はSEEMをEDVRとBasicVSRの2つの代表的手法に適用し、最小限の実装労力で継続的に性能を向上する。
論文 参考訳(メタデータ) (2023-05-11T02:02:53Z) - Pose Correction Algorithm for Relative Frames between Keyframes in SLAM [20.579218922577244]
相対的なフレームのポーズは通常、オンラインアプリケーションを達成するためのより高速なアルゴリズムのために犠牲にされている。
本稿では,更新後のランドマーク間の相対的フレームを補正するアルゴリズムを提案する。
提案アルゴリズムは既存のSLAMシステムと容易に統合できるように設計されている。
論文 参考訳(メタデータ) (2020-09-18T09:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。