論文の概要: Multi-threshold Deep Metric Learning for Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2406.16434v1
- Date: Mon, 24 Jun 2024 08:27:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 15:43:33.451207
- Title: Multi-threshold Deep Metric Learning for Facial Expression Recognition
- Title(参考訳): 表情認識のためのマルチスレッド深度学習
- Authors: Wenwu Yang, Jinyi Yu, Tuo Chen, Zhenguang Liu, Xun Wang, Jianbing Shen,
- Abstract要約: 本稿では,難易度検証を回避する多閾値深度学習手法を提案する。
その結果,三重項損失のそれぞれの閾値は本質的にクラス間変動の特異な分布を決定することがわかった。
埋め込み層はスライスで構成されており、より情報的で差別的な特徴である。
- 参考スコア(独自算出の注目度): 60.26967776920412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effective expression feature representations generated by a triplet-based deep metric learning are highly advantageous for facial expression recognition (FER). The performance of triplet-based deep metric learning is contingent upon identifying the best threshold for triplet loss. Threshold validation, however, is tough and challenging, as the ideal threshold changes among datasets and even across classes within the same dataset. In this paper, we present the multi-threshold deep metric learning technique, which not only avoids the difficult threshold validation but also vastly increases the capacity of triplet loss learning to construct expression feature representations. We find that each threshold of the triplet loss intrinsically determines a distinctive distribution of inter-class variations and corresponds, thus, to a unique expression feature representation. Therefore, rather than selecting a single optimal threshold from a valid threshold range, we thoroughly sample thresholds across the range, allowing the representation characteristics manifested by thresholds within the range to be fully extracted and leveraged for FER. To realize this approach, we partition the embedding layer of the deep metric learning network into a collection of slices and model training these embedding slices as an end-to-end multi-threshold deep metric learning problem. Each embedding slice corresponds to a sample threshold and is learned by enforcing the corresponding triplet loss, yielding a set of distinct expression features, one for each embedding slice. It makes the embedding layer, which is composed of a set of slices, a more informative and discriminative feature, hence enhancing the FER accuracy. Extensive evaluations demonstrate the superior performance of the proposed approach on both posed and spontaneous facial expression datasets.
- Abstract(参考訳): 三重項に基づくディープメトリック学習によって生成される効果的な表情特徴表現は、表情認識(FER)に非常に有利である。
三重項に基づくディープ・メトリック・ラーニングの性能は三重項損失の最良のしきい値を特定することによって決定される。
しかし、データセット間の理想的なしきい値が、同じデータセット内のクラス間でも変化するため、閾値検証は難しくて難しい。
本稿では,難解なしきい値検証を回避するだけでなく,表現特徴表現を構築するために三重項損失学習の能力を大幅に向上させる多閾値深度計量学習手法を提案する。
その結果,三重項損失の閾値は本質的にクラス間変動の特異な分布を決定づけ,一意的な表現特徴表現に対応することがわかった。
したがって、有効なしきい値範囲から1つの最適しきい値を選択するのではなく、範囲をまたいだしきい値を徹底的にサンプリングし、範囲内のしきい値によって表される表現特性を完全に抽出し、FERに活用することができる。
このアプローチを実現するために,ディープメトリック学習ネットワークの埋め込み層をスライス集合に分割し,その埋め込み層をエンドツーエンドのマルチスレッドのディープメトリック学習問題としてモデル化する。
各埋め込みスライスはサンプル閾値に対応し、対応する三重項損失を強制して学習し、各埋め込みスライス毎にそれぞれ異なる表現特徴のセットを生成する。
これにより、一組のスライスからなる埋め込み層がより情報的で識別性の高い特徴となり、FER精度が向上する。
顔表情データセットと自然表情データセットの両方において,提案手法の優れた性能を示す。
関連論文リスト
- ASM: Adaptive Sample Mining for In-The-Wild Facial Expression
Recognition [19.846612021056565]
適応サンプルマイニング(Adaptive Sample Mining)と呼ばれる新しい手法を導入し,各表現カテゴリのあいまいさとノイズに対処する。
本手法は、曖昧性とノイズの両方を効果的にマイニングし、合成ノイズとオリジナルデータセットの両方でSOTA法より優れる。
論文 参考訳(メタデータ) (2023-10-09T11:18:22Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Triplet Loss-less Center Loss Sampling Strategies in Facial Expression
Recognition Scenarios [5.672538282456803]
ディープ・ニューラルネットワーク(DNN)とディープ・メトリック・ラーニング(DML)技術は、モデルInFERアプリケーションの識別能力を高める。
我々は, 完全合成, 半合成, 予測に基づく負のサンプル選択戦略の3つの戦略を開発した。
より優れた結果を得るために、画素ワイドと素子ワイドのアテンション係数の組み合わせを提供する選択的アテンションモジュールを導入する。
論文 参考訳(メタデータ) (2023-02-08T15:03:36Z) - Pixel is All You Need: Adversarial Trajectory-Ensemble Active Learning
for Salient Object Detection [40.97103355628434]
弱教師付きデータで訓練されたサリエンシモデルがその完全教師付きバージョンの同等のパフォーマンスを達成できるかどうかは不明である。
我々は,新しい対向軌道アンサンブルアクティブラーニング(ATAL)を提案する。
実験の結果、私たちのALTはそのようなポイントラベル付きデータセットを見つけることができ、トレーニングされたサリエンシモデルは、イメージ毎に10の注釈付きポイントしか持たないフル教師付きバージョンの97%$ --99%のパフォーマンスを得ることができた。
論文 参考訳(メタデータ) (2022-12-13T11:18:08Z) - Rank-Consistency Deep Hashing for Scalable Multi-Label Image Search [90.30623718137244]
スケーラブルなマルチラベル画像検索のための新しいディープハッシュ法を提案する。
2つの空間の類似性順序を整列するために、新しい階数整合性目的を適用した。
強力な損失関数は、意味的類似性とハミング距離が一致しないサンプルをペナルティ化するように設計されている。
論文 参考訳(メタデータ) (2021-02-02T13:46:58Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z) - Personalized Activity Recognition with Deep Triplet Embeddings [2.1320960069210475]
本稿では,完全畳み込み型ニューラルネットワークによる深層埋め込みに基づく個人化された活動認識手法を提案する。
我々は,これらの手法を3つの一般公開された慣性人間活動認識データセット上で評価する。
論文 参考訳(メタデータ) (2020-01-15T19:17:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。