論文の概要: Facial Action Unit Intensity Estimation via Semantic Correspondence
Learning with Dynamic Graph Convolution
- arxiv url: http://arxiv.org/abs/2004.09681v1
- Date: Mon, 20 Apr 2020 23:55:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 19:06:31.081514
- Title: Facial Action Unit Intensity Estimation via Semantic Correspondence
Learning with Dynamic Graph Convolution
- Title(参考訳): 動的グラフ畳み込みを用いた意味対応学習による顔行動単位強度推定
- Authors: Yingruo Fan, Jacqueline C.K. Lam, Victor O.K. Li
- Abstract要約: 本稿では,特徴マップ間の意味的対応を確立することによって,AUの潜伏関係を自動的に学習する学習フレームワークを提案する。
熱マップ回帰に基づくネットワークでは、特徴写像はAU強度と位置に関連する豊富な意味情報を保存する。
これはAU強度レベルの共起関係を暗黙的に表す特徴チャネル間の相関をモデル化する動機となっている。
- 参考スコア(独自算出の注目度): 27.48620879003556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The intensity estimation of facial action units (AUs) is challenging due to
subtle changes in the person's facial appearance. Previous approaches mainly
rely on probabilistic models or predefined rules for modeling co-occurrence
relationships among AUs, leading to limited generalization. In contrast, we
present a new learning framework that automatically learns the latent
relationships of AUs via establishing semantic correspondences between feature
maps. In the heatmap regression-based network, feature maps preserve rich
semantic information associated with AU intensities and locations. Moreover,
the AU co-occurring pattern can be reflected by activating a set of feature
channels, where each channel encodes a specific visual pattern of AU. This
motivates us to model the correlation among feature channels, which implicitly
represents the co-occurrence relationship of AU intensity levels. Specifically,
we introduce a semantic correspondence convolution (SCC) module to dynamically
compute the correspondences from deep and low resolution feature maps, and thus
enhancing the discriminability of features. The experimental results
demonstrate the effectiveness and the superior performance of our method on two
benchmark datasets.
- Abstract(参考訳): 顔の表情が微妙に変化するため,顔動作単位(AU)の強度推定は困難である。
従来のアプローチは主にAU間の共起関係をモデル化するための確率モデルや事前定義された規則に依存しており、限定的な一般化をもたらす。
対照的に,機能マップ間の意味対応を確立することによって,ausの潜在関係を自動的に学習する新しい学習フレームワークを提案する。
熱マップ回帰に基づくネットワークでは、特徴写像はAU強度と位置に関連する豊富な意味情報を保存する。
さらに、AU共起パターンは、各チャンネルがAUの特定の視覚パターンを符号化する一連の特徴チャネルを活性化することにより反映することができる。
これはAU強度レベルの共起関係を暗黙的に表す特徴チャネル間の相関をモデル化する動機となっている。
具体的には,深層および低分解能特徴マップからの対応を動的に計算する意味対応畳み込み(scc)モジュールを導入し,特徴の識別性を高める。
実験結果は,2つのベンチマークデータセットにおいて,提案手法の有効性と優れた性能を示す。
関連論文リスト
- Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.65152276851619]
関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。
本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。
RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文 参考訳(メタデータ) (2023-09-20T08:11:58Z) - FECANet: Boosting Few-Shot Semantic Segmentation with Feature-Enhanced
Context-Aware Network [48.912196729711624]
Few-shot セマンティックセグメンテーション(Few-shot semantic segmentation)は、新しいクラスの各ピクセルを、わずかに注釈付きサポートイメージで検索するタスクである。
本稿では,クラス間の類似性に起因するマッチングノイズを抑制するために,機能拡張コンテキスト認識ネットワーク(FECANet)を提案する。
さらに,前景と背景の余分な対応関係を符号化する新たな相関再構成モジュールを提案する。
論文 参考訳(メタデータ) (2023-01-19T16:31:13Z) - Attention Based Relation Network for Facial Action Units Recognition [8.522262699196412]
本稿では,AU認識のための新しいアテンションベース関係ネットワーク(ABRNet)を提案する。
ABRNetは複数の関係学習レイヤを使用して、異なるAU関係を自動的にキャプチャする。
提案手法は,disFAとdisFA+データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-10-23T11:26:53Z) - Insights on Neural Representations for End-to-End Speech Recognition [28.833851817220616]
エンドツーエンド自動音声認識(ASR)モデルは、一般化された音声表現を学習することを目的としている。
相関解析手法を用いたネットワーク類似性の調査は、エンド・ツー・エンドASRモデルでは行われていない。
本稿では,CNN,LSTM,Transformerをベースとしたトレーニングにおいて,レイヤ間の内部ダイナミクスを解析し,検討する。
論文 参考訳(メタデータ) (2022-05-19T10:19:32Z) - Learning Multi-dimensional Edge Feature-based AU Relation Graph for
Facial Action Unit Recognition [27.34564955127377]
顔行動ユニット(AU)の活性化は相互に影響を及ぼす。
既存のアプローチでは、顔ディスプレイの各ペアのAUに対して、明確にかつ明示的にそのようなキューを表現できない。
本稿では,AU間の関係を明確に記述するために,一意のグラフを深く学習するAU関係モデリング手法を提案する。
論文 参考訳(メタデータ) (2022-05-02T03:38:00Z) - Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。
ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。
提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-23T10:08:15Z) - Multiple Object Tracking with Correlation Learning [16.959379957515974]
本研究では,局所相関モジュールを用いて,対象と周辺環境のトポロジカルな関係をモデル化する。
具体的には,各空間の位置とその文脈の密接な対応を確立し,自己教師付き学習を通じて相関量を明確に制約する。
提案手法は, 相関学習と優れた性能の相関学習の有効性を示し, MOT17では76.5%, IDF1では73.6%の最先端MOTAが得られる。
論文 参考訳(メタデータ) (2021-04-08T06:48:02Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。