論文の概要: Learning to Rank Onset-Occurring-Offset Representations for
Micro-Expression Recognition
- arxiv url: http://arxiv.org/abs/2310.04664v1
- Date: Sat, 7 Oct 2023 03:09:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 16:58:38.416224
- Title: Learning to Rank Onset-Occurring-Offset Representations for
Micro-Expression Recognition
- Title(参考訳): マイクロ圧縮認識のためのオンセット・オーカリング・オフセット表現の学習
- Authors: Jie Zhu, Yuan Zong, Jingang Shi, Cheng Lu, Hongli Chang, Wenming Zheng
- Abstract要約: 本稿では,マイクロ圧縮認識(MER)の研究に焦点をあてる。
オンセットオフセット表現(LTR3O)をランク付けする学習法という,柔軟で信頼性の高い深層学習手法を提案する。
- 参考スコア(独自算出の注目度): 24.75382410411772
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on the research of micro-expression recognition (MER) and
proposes a flexible and reliable deep learning method called learning to rank
onset-occurring-offset representations (LTR3O). The LTR3O method introduces a
dynamic and reduced-size sequence structure known as 3O, which consists of
onset, occurring, and offset frames, for representing micro-expressions (MEs).
This structure facilitates the subsequent learning of ME-discriminative
features. A noteworthy advantage of the 3O structure is its flexibility, as the
occurring frame is randomly extracted from the original ME sequence without the
need for accurate frame spotting methods. Based on the 3O structures, LTR3O
generates multiple 3O representation candidates for each ME sample and
incorporates well-designed modules to measure and calibrate their emotional
expressiveness. This calibration process ensures that the distribution of these
candidates aligns with that of macro-expressions (MaMs) over time.
Consequently, the visibility of MEs can be implicitly enhanced, facilitating
the reliable learning of more discriminative features for MER. Extensive
experiments were conducted to evaluate the performance of LTR3O using three
widely-used ME databases: CASME II, SMIC, and SAMM. The experimental results
demonstrate the effectiveness and superior performance of LTR3O, particularly
in terms of its flexibility and reliability, when compared to recent
state-of-the-art MER methods.
- Abstract(参考訳): 本稿では,マイクロ表現認識(mer)の研究に焦点をあて,学習と呼ばれるフレキシブルで信頼性の高いディープラーニング手法を提案する。
LTR3O法は、3Oと呼ばれる動的で縮小されたシーケンス構造を導入し、マイクロ表現(ME)を表現するために、オンセット、発生、オフセットフレームで構成される。
この構造は、その後のME識別特徴の学習を促進する。
3o構造の特筆すべき利点は、正確なフレームスポッティング法を必要とせず、元のmeシーケンスからランダムにフレームを抽出することで、その柔軟性である。
3O構造に基づいて、LTR3Oは各MEサンプルに対して複数の3O表現候補を生成し、よく設計されたモジュールを組み込んで感情表現性を測定・校正する。
このキャリブレーションプロセスにより、これらの候補の分布は時間とともにマクロ表現(MaM)の分布と一致する。
したがって、MEの可視性は暗黙的に向上し、MERのより差別的な特徴の信頼できる学習を促進することができる。
CASME II, SMIC, SAMMの3つの広く利用されているMEデータベースを用いたLTR3Oの性能評価実験を行った。
実験の結果,最近の最先端MER法と比較して,LTR3Oの有効性と性能,特にその柔軟性と信頼性を実証した。
関連論文リスト
- Multi-threshold Deep Metric Learning for Facial Expression Recognition [60.26967776920412]
本稿では,難易度検証を回避する多閾値深度学習手法を提案する。
その結果,三重項損失のそれぞれの閾値は本質的にクラス間変動の特異な分布を決定することがわかった。
埋め込み層はスライスで構成されており、より情報的で差別的な特徴である。
論文 参考訳(メタデータ) (2024-06-24T08:27:31Z) - Continual Referring Expression Comprehension via Dual Modular
Memorization [133.46886428655426]
Referring Expression (REC) は、自然言語で記述された対象のイメージ領域をローカライズすることを目的としている。
既存のRECアルゴリズムは、モデルへのデータ供給のトレーニングを前もって行うと強く仮定する。
本稿では、入ってくるタスクのストリーム上でモデルが学習するRECの新しい設定である連続参照表現(CREC)を提案する。
学習済みの知識を忘れずに,スクラッチから繰り返し再学習することなく,逐次的タスクのモデルを継続的に改善するために,デュアルモジュール記憶法という効果的なベースライン手法を提案する。
論文 参考訳(メタデータ) (2023-11-25T02:58:51Z) - Extending Multi-modal Contrastive Representations [53.923340739349314]
3つ以上のモダリティのマルチモーダルコントラスト表現(MCR)は、マルチモーダル学習において重要である。
最近のC-MCRにインスパイアされた本論文では,拡張マルチモーダルコントラスト表現(Ex-MCR)を提案する。
元MCRは3つ以上のモダリティのコントラスト表現空間を柔軟に学習する訓練効率とペアデータフリーの手法である。
論文 参考訳(メタデータ) (2023-10-13T06:34:23Z) - Feature Representation Learning with Adaptive Displacement Generation
and Transformer Fusion for Micro-Expression Recognition [18.6490971645882]
マイクロ表現は自然に、素早く、微妙な顔の動きであり、偽造も抑制もできない。
適応的変位生成と変圧器融合(FRL-DGT)を用いた特徴表現学習フレームワークを提案する。
ソリッド・エンド・ワン・オブジェクト・アウト (LOSO) 評価実験により, 提案したFRL-DGTの最先端手法に対する優位性を実証した。
論文 参考訳(メタデータ) (2023-04-10T07:03:36Z) - Effective and Stable Role-Based Multi-Agent Collaboration by Structural
Information Principles [24.49065333729887]
本稿では,役割発見のための数学的構造情報に基づく役割発見法,すなわちSIRDを提案する。
次に,マルチエージェント協調のためのSIRD最適化型マルチエージェント強化学習フレームワークSR-MARLを提案する。
具体的には、SIRDは構造化、スパーシフィケーション、最適化モジュールで構成され、最適なエンコーディングツリーを生成して、役割を発見するための抽象化を実行する。
論文 参考訳(メタデータ) (2023-04-03T07:13:44Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Short and Long Range Relation Based Spatio-Temporal Transformer for
Micro-Expression Recognition [61.374467942519374]
我々は,マイクロ圧縮認識のための最初の純粋トランスフォーマーベースアプローチである,新しいアテンポ的トランスフォーマーアーキテクチャを提案する。
空間パターンを学習する空間エンコーダと、時間的分析のための時間的次元分類と、ヘッドとを備える。
広範に使用されている3つの自発的マイクロ圧縮データセットに対する総合的な評価は,提案手法が一貫して芸術の状態を上回っていることを示している。
論文 参考訳(メタデータ) (2021-12-10T22:10:31Z) - MMD-ReID: A Simple but Effective Solution for Visible-Thermal Person
ReID [20.08880264104061]
本稿では,モダリティギャップを明示的な差分低減制約によって低減する,シンプルで効果的なMDD-ReIDを提案する。
我々はMDD-ReIDの有効性を定性的かつ定量的に実証するための広範囲な実験を行った。
提案手法は,SYSU-MM01およびRegDBデータセットにおける最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-11-09T11:33:32Z) - Data-Driven Learning of 3-Point Correlation Functions as Microstructure
Representations [8.978973486638253]
様々なミクロ構造が3点相関の簡潔な部分集合によって特徴づけられることを示す。
提案した表現は, 有効媒質理論に基づく材料特性の計算に利用することができる。
論文 参考訳(メタデータ) (2021-09-06T06:15:57Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。