Fugu-MT 論文翻訳(概要): Multi-scale Dynamic and Hierarchical Relationship Modeling for Facial Action Units Recognition

論文の概要: Multi-scale Dynamic and Hierarchical Relationship Modeling for Facial Action Units Recognition

arxiv url: http://arxiv.org/abs/2404.06443v1
Date: Tue, 9 Apr 2024 16:45:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-10 13:51:47.802135
Title: Multi-scale Dynamic and Hierarchical Relationship Modeling for Facial Action Units Recognition
Title（参考訳）: 顔行動単位認識のためのマルチスケール動的・階層的関係モデリング
Authors: Zihan Wang, Siyang Song, Cheng Luo, Songhe Deng, Weicheng Xie, Linlin Shen,
Abstract要約: ヒューマン・フェイス・アクション・ユニット(AU)は階層的な方法で相互に関連している。同じ/クローズな顔領域に位置するAUは、異なる顔領域よりも強い関係を示す。本稿では,出現認識のための新しいマルチスケールAUモデルを提案する。
参考スコア（独自算出の注目度）: 38.62221940006509
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Human facial action units (AUs) are mutually related in a hierarchical manner, as not only they are associated with each other in both spatial and temporal domains but also AUs located in the same/close facial regions show stronger relationships than those of different facial regions. While none of existing approach thoroughly model such hierarchical inter-dependencies among AUs, this paper proposes to comprehensively model multi-scale AU-related dynamic and hierarchical spatio-temporal relationship among AUs for their occurrences recognition. Specifically, we first propose a novel multi-scale temporal differencing network with an adaptive weighting block to explicitly capture facial dynamics across frames at different spatial scales, which specifically considers the heterogeneity of range and magnitude in different AUs' activation. Then, a two-stage strategy is introduced to hierarchically model the relationship among AUs based on their spatial distribution (i.e., local and cross-region AU relationship modelling). Experimental results achieved on BP4D and DISFA show that our approach is the new state-of-the-art in the field of AU occurrence recognition. Our code is publicly available at https://github.com/CVI-SZU/MDHR.
Abstract（参考訳）: ヒトの顔行動単位(AUs)は、空間的・時間的両方の領域において互いに関連付けられているだけでなく、同一/クローズな顔領域に位置するAUsは、異なる顔領域のそれよりも強い関係を示すため、階層的に相互に関連している。本稿では,AU間の階層的相互依存性を網羅的にモデル化する手法は存在しないが,AU間の動的・階層的時空間的関係を包括的にモデル化して認識する手法を提案する。具体的には、まず、異なる空間スケールでフレーム間の顔のダイナミクスを明示的にキャプチャする適応重み付けブロックを備えた、新しいマルチスケール時間差分ネットワークを提案し、特に異なるAUのアクティベーションにおける範囲と大きさの不均一性について検討する。次に、空間分布(地域間および地域間AU関係モデリング)に基づいて、AU間の関係を階層的にモデル化する2段階戦略を導入する。 BP4D と DISFA を用いた実験結果から,AU 発生認識の分野における新たな最先端技術であることがわかった。私たちのコードはhttps://github.com/CVI-SZU/MDHR.comで公開されています。

関連論文リスト

Decoupled Doubly Contrastive Learning for Cross Domain Facial Action Unit Detection [66.80386429324196]
そこで本稿では,AU 表現を2つに分離した2つのコントラスト適応 (D$2$CA) 手法を提案する。 D$2$CAは、合成顔の質を評価することにより、AUとドメイン因子を乱すように訓練される。最先端のクロスドメインAU検出アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2025-03-12T00:42:17Z)
How to Bridge Spatial and Temporal Heterogeneity in Link Prediction? A Contrastive Method [11.719027225797037]
我々は,新しいtextbfContrastive Learning-based textbfLink textbfPrediction model, textbfCLPを提案する。我々のマイモデルは最先端モデルよりも一貫して優れており、AUCとAPで平均10.10%、13.44%の改善が示されている。
論文参考訳（メタデータ） (2024-11-01T14:20:53Z)
A Decoupled Spatio-Temporal Framework for Skeleton-based Action Segmentation [89.86345494602642]
既存の手法は、弱い時間的モデリング能力に制限されている。この問題に対処するために、Decoupled Scoupled Framework (DeST)を提案する。 DeSTは計算量が少なく、現在の最先端の手法を著しく上回っている。
論文参考訳（メタデータ） (2023-12-10T09:11:39Z)
Learning Multi-dimensional Edge Feature-based AU Relation Graph for Facial Action Unit Recognition [27.34564955127377]
顔行動ユニット(AU)の活性化は相互に影響を及ぼす。既存のアプローチでは、顔ディスプレイの各ペアのAUに対して、明確にかつ明示的にそのようなキューを表現できない。本稿では,AU間の関係を明確に記述するために,一意のグラフを深く学習するAU関係モデリング手法を提案する。
論文参考訳（メタデータ） (2022-05-02T03:38:00Z)
Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-28T02:12:30Z)
Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文参考訳（メタデータ） (2021-04-23T10:08:15Z)
Multi-Level Adaptive Region of Interest and Graph Learning for Facial Action Unit Recognition [30.129452080084224]
本稿では,この問題に対処するための多段階適応ROIとグラフ学習(MARGL)フレームワークを提案する。レベル内AU関係とレベル間AU地域関連を同時に組み込むために、マルチレベルAU関係グラフを構築する。 BP4D と DISFA の実験では,提案した MARGL が従来の最先端手法よりも優れていたことが示されている。
論文参考訳（メタデータ） (2021-02-24T09:22:45Z)
AU-Guided Unsupervised Domain Adaptive Facial Expression Recognition [21.126514122636966]
本稿では、異なるFERデータセット間のアノテーションバイアスを軽減するためのAUガイド付き非監視ドメイン適応FERフレームワークを提案する。ドメイン不変のコンパクトな機能を実現するために、AUを用いた両ドメインのアンカー正負の三つ子をランダムに収集するAUガイドトリプルトトレーニングを利用します。
論文参考訳（メタデータ） (2020-12-18T07:17:30Z)
Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文参考訳（メタデータ） (2020-10-12T13:26:30Z)
Facial Action Unit Intensity Estimation via Semantic Correspondence Learning with Dynamic Graph Convolution [27.48620879003556]
本稿では,特徴マップ間の意味的対応を確立することによって,AUの潜伏関係を自動的に学習する学習フレームワークを提案する。熱マップ回帰に基づくネットワークでは、特徴写像はAU強度と位置に関連する豊富な意味情報を保存する。これはAU強度レベルの共起関係を暗黙的に表す特徴チャネル間の相関をモデル化する動機となっている。
論文参考訳（メタデータ） (2020-04-20T23:55:30Z)
Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文参考訳（メタデータ） (2020-03-09T17:05:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。