論文の概要: Optimal Transport-based Identity Matching for Identity-invariant Facial
Expression Recognition
- arxiv url: http://arxiv.org/abs/2209.12172v1
- Date: Sun, 25 Sep 2022 07:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 16:14:59.068741
- Title: Optimal Transport-based Identity Matching for Identity-invariant Facial
Expression Recognition
- Title(参考訳): 同一性不変顔表情認識のための最適移動ベースIDマッチング
- Authors: Daeha Kim and Byung Cheol Song
- Abstract要約: アイデンティティ不変な表情認識(FER)は、コンピュータビジョンの課題のひとつだ。
本稿では,特定のマッチングプロセスを通じて探索された類似表現のペアを利用して,同一性間の変動を定量化する。
提案手法は,他のモデルに簡単に接続できるだけでなく,計算オーバーヘッドも許容できる。
- 参考スコア(独自算出の注目度): 33.072870202596725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identity-invariant facial expression recognition (FER) has been one of the
challenging computer vision tasks. Since conventional FER schemes do not
explicitly address the inter-identity variation of facial expressions, their
neural network models still operate depending on facial identity. This paper
proposes to quantify the inter-identity variation by utilizing pairs of similar
expressions explored through a specific matching process. We formulate the
identity matching process as an Optimal Transport (OT) problem. Specifically,
to find pairs of similar expressions from different identities, we define the
inter-feature similarity as a transportation cost. Then, optimal identity
matching to find the optimal flow with minimum transportation cost is performed
by Sinkhorn-Knopp iteration. The proposed matching method is not only easy to
plug in to other models, but also requires only acceptable computational
overhead. Extensive simulations prove that the proposed FER method improves the
PCC/CCC performance by up to 10\% or more compared to the runner-up on wild
datasets. The source code and software demo are available at
https://github.com/kdhht2334/ELIM_FER.
- Abstract(参考訳): アイデンティティ不変な表情認識(FER)は、コンピュータビジョンの課題のひとつだ。
従来のFERスキームは、表情の同一性間の変動に明示的に対処していないため、ニューラルネットワークモデルはまだ顔の同一性に依存している。
本稿では,特定のマッチングプロセスを通じて探索された類似表現のペアを利用して,同一性間の変動を定量化する。
同一性マッチングプロセスを最適輸送(OT)問題として定式化する。
具体的には、異なるアイデンティティから類似表現のペアを見つけるために、機能間類似性を輸送コストとして定義する。
次に,Sinkhorn-Knopp繰り返しにより,最小輸送コストで最適流れを求めるための最適同一性マッチングを行う。
提案手法は他のモデルへの接続が容易であるだけでなく、許容される計算オーバーヘッドも必要である。
大規模シミュレーションにより,提案手法は野生データセットの次点に比べてpcc/ccc性能を最大10\%向上できることが証明された。
ソースコードとソフトウェアデモはhttps://github.com/kdhht2334/ELIM_FERで公開されている。
関連論文リスト
- The Balanced-Pairwise-Affinities Feature Transform [2.3020018305241337]
BPA機能変換は、入力項目のセットの機能をアップグレードして、下流のマッチングや関連するタスクのグループ化を容易にするように設計されている。
特定の min- Cost-max-flow の分数マッチング問題は、効率的、微分可能、同変、パラメータレス、確率論的に解釈可能な変換をもたらす。
経験的には、この変換はその使用において非常に効果的で柔軟性があり、様々なタスクやトレーニングスキームにおいて挿入されるネットワークを継続的に改善する。
論文 参考訳(メタデータ) (2024-06-25T14:28:05Z) - SwinFace: A Multi-task Transformer for Face Recognition, Expression
Recognition, Age Estimation and Attribute Estimation [60.94239810407917]
本論文では,単一スウィントランスを用いた顔認識,表情認識,年齢推定,顔属性推定のための多目的アルゴリズムを提案する。
複数のタスク間の競合に対処するため、マルチレベルチャネル注意(MLCA)モジュールをタスク固有の分析に統合する。
実験の結果,提案したモデルでは顔の理解が良く,全てのタスクにおいて優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-08-22T15:38:39Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - SIM2E: Benchmarking the Group Equivariant Capability of Correspondence
Matching Algorithms [12.892976023503818]
本稿では,sim(2)-同変対応マッチングアルゴリズムの評価専用のデータセットを提案する。
我々は16の最先端(SoTA)対応マッチング手法の性能を比較した。
CNNベースの対応マッチングアプローチによって達成されるサブピクセル精度は満足できないため、この特定領域は今後の研究により多くの注意を要する。
論文 参考訳(メタデータ) (2022-08-21T14:47:02Z) - Disentangling Identity and Pose for Facial Expression Recognition [54.50747989860957]
より識別的な特徴表現を学習するために,識別モデルを提案し,不整形表情認識(IPD-FER)モデルを提案する。
アイデンティティエンコーダでは、訓練中に訓練済みの顔認識モデルを利用して固定し、特定の表情訓練データに対する制限を軽減する。
合成された中性画像と同一個体の表情画像との差を比較することにより、表現成分はアイデンティティやポーズからさらに切り離される。
論文 参考訳(メタデータ) (2022-08-17T06:48:13Z) - Dynamic Prototype Mask for Occluded Person Re-Identification [88.7782299372656]
既存の手法では、目に見える部分を識別するために、余分なネットワークによって提供される身体の手がかりを利用することで、この問題に対処している。
2つの自己明快な事前知識に基づく新しい動的プロトタイプマスク(DPM)を提案する。
この条件下では、隠蔽された表現は、選択された部分空間において自然にうまく整列することができる。
論文 参考訳(メタデータ) (2022-07-19T03:31:13Z) - Learning Fair Face Representation With Progressive Cross Transformer [79.73754444296213]
フェアフェイス認識のためのプログレッシブクロストランス (PCT) 手法を提案する。
我々は,PCTが最先端FR性能を達成しつつ,顔認識におけるバイアスを軽減することができることを示した。
論文 参考訳(メタデータ) (2021-08-11T01:31:14Z) - AOT: Appearance Optimal Transport Based Identity Swapping for Forgery
Detection [76.7063732501752]
顔偽造検出のための外観の相違が大きい新しい識別スワップアルゴリズムを提案する。
外観のギャップは主に、照明と肌の色における大きな相違から生じる。
実画像パッチと偽画像パッチの混在とを識別するために識別器を導入する。
論文 参考訳(メタデータ) (2020-11-05T06:17:04Z) - Mutual Information Regularized Identity-aware Facial
ExpressionRecognition in Compressed Video [27.602648102881535]
本稿では,相互情報(MI)を最小化するための新しい協調ミンミニゲームを提案する。
同一人物からの識別ラベルや複数の表現サンプルは不要である。
我々のソリューションは、最近のデコードされた画像ベース手法に匹敵する、あるいは優れた性能を実現することができる。
論文 参考訳(メタデータ) (2020-10-20T21:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。