論文の概要: Region attention and graph embedding network for occlusion objective
class-based micro-expression recognition
- arxiv url: http://arxiv.org/abs/2107.05904v1
- Date: Tue, 13 Jul 2021 08:04:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 23:33:36.064092
- Title: Region attention and graph embedding network for occlusion objective
class-based micro-expression recognition
- Title(参考訳): 咬合対象クラスに基づくマイクロ表現認識のための領域注意とグラフ埋め込みネットワーク
- Authors: Qirong Mao, Ling Zhou, Wenming Zheng, Xiuyan Shao, Xiaohua Huang
- Abstract要約: マイクロ圧縮認識(textbfMER)は10年間にわたって多くの研究者の注目を集めてきた。
本稿では,MER,ie,occlusion MERにおける興味深いが未解明の課題を深く研究する。
種々の顔領域間の関係をモデル化するために、アンダーラインRegionにインスパイアされたアンダーラインリレーションアンダーラインネットワーク(textbfRRRN)を提案する。
- 参考スコア(独自算出の注目度): 26.5638344747854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Micro-expression recognition (\textbf{MER}) has attracted lots of
researchers' attention in a decade. However, occlusion will occur for MER in
real-world scenarios. This paper deeply investigates an interesting but
unexplored challenging issue in MER, \ie, occlusion MER. First, to research MER
under real-world occlusion, synthetic occluded micro-expression databases are
created by using various mask for the community. Second, to suppress the
influence of occlusion, a \underline{R}egion-inspired \underline{R}elation
\underline{R}easoning \underline{N}etwork (\textbf{RRRN}) is proposed to model
relations between various facial regions. RRRN consists of a backbone network,
the Region-Inspired (\textbf{RI}) module and Relation Reasoning (\textbf{RR})
module. More specifically, the backbone network aims at extracting feature
representations from different facial regions, RI module computing an adaptive
weight from the region itself based on attention mechanism with respect to the
unobstructedness and importance for suppressing the influence of occlusion, and
RR module exploiting the progressive interactions among these regions by
performing graph convolutions. Experiments are conducted on handout-database
evaluation and composite database evaluation tasks of MEGC 2018 protocol.
Experimental results show that RRRN can significantly explore the importance of
facial regions and capture the cooperative complementary relationship of facial
regions for MER. The results also demonstrate RRRN outperforms the
state-of-the-art approaches, especially on occlusion, and RRRN acts more robust
to occlusion.
- Abstract(参考訳): マイクロ表現認識(\textbf{mer})は10年間で多くの研究者の注目を集めている。
しかし、現実のシナリオではmerでは閉塞が起こる。
本稿では、MER, \ie, occlusion MERにおける興味深いが未解明の課題を深く研究する。
まず,merを実世界のオクルージョン下で研究するために,コミュニティのために様々なマスクを用いて合成オクルード型マイクロ表現データベースを作成する。
第二に、オクルージョンの影響を抑制するために、様々な顔領域間の関係をモデル化するために、アンダーライン{R}easoning \underline{R}easoning \underline{N}etwork (\textbf{RRRN})を提案する。
RRRNは、バックボーンネットワーク、Regional-Inspired (\textbf{RI})モジュール、Relation Reasoning (\textbf{RR})モジュールで構成される。
具体的には、異なる顔領域から特徴表現を抽出することを目的としたバックボーンネットワーク、未閉塞性や閉塞の影響を抑えることの重要性を考慮し、注意機構に基づいて地域自体から適応重みを演算するRIモジュール、グラフ畳み込みによってこれらの領域間の進行的相互作用を利用するRRモジュール。
MEGC 2018プロトコルのハンドアウトデータベース評価および複合データベース評価タスクについて実験を行った。
実験の結果,RRRNは顔面領域の重要性を明らかに把握し,MERにおける顔面領域の協調補完関係を捉えることができることがわかった。
その結果、RRRNは最先端のアプローチ、特に閉塞に対して優れており、RRRNは閉塞に対してより堅牢であることを示した。
関連論文リスト
- Global Occlusion-Aware Transformer for Robust Stereo Matching [11.655465312241699]
本稿では,Global Occlusion-Aware Transformer(GOAT)と呼ばれる新しいアテンションベースのステレオマッチングネットワークを提案する。
GOATは、長距離依存とOcclusion-Awarenessグローバルコンテキストを不一致推定に活用する。
提案したGOATは,特に閉鎖領域において,すべてのベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-22T12:34:58Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Region Generation and Assessment Network for Occluded Person
Re-Identification [43.49129366128688]
個人再識別(ReID)は近年,幅広い応用分野において,より重要な役割を担っている。
ほとんどの手法は、ボディ部分の特定やマッチング戦略の活用に外部ツールを活用することで、このような課題に対処する。
人体領域を効果的かつ効率的に検出する領域生成評価ネットワーク(RGANet)を提案する。
論文 参考訳(メタデータ) (2023-09-07T08:41:47Z) - Learning Federated Visual Prompt in Null Space for MRI Reconstruction [83.71117888610547]
我々はMRI再建のためのグローバルプロンプトのヌル空間におけるフェデレートされた視覚的プロンプトを学習するための新しいアルゴリズムであるFedPRを提案する。
FedPRは、ローカルトレーニングデータの限られた量を与えられた場合、通信コストの6%で最先端のFLアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2023-03-28T17:46:16Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - PS-ARM: An End-to-End Attention-aware Relation Mixer Network for Person
Search [56.02761592710612]
モジュール・パーソン・サーチのための新しいアテンション・アウェア・リレーション・ミキサー(ARM)を提案する。
私たちのARMモジュールはネイティブで、きめ細かい監督やトポロジカルな仮定に依存していません。
我々のPS-ARMは、両方のデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-10-07T10:04:12Z) - Reasoning Structural Relation for Occlusion-Robust Facial Landmark
Localization [5.171058506312429]
本稿では,オクルージョン・ロバストなランドマークローカライゼーションのための構造関係ネットワーク(SRN)を提案する。
形状制約を単純に活用する既存の方法とは異なり、提案したSRNは異なる顔成分間の構造的関係を捉えることを目的としている。
提案手法は,隠蔽面とマスク面の優れた性能を実現する。
論文 参考訳(メタデータ) (2021-12-19T08:27:37Z) - Unsupervised Instance Segmentation in Microscopy Images via Panoptic
Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。
まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。
第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文 参考訳(メタデータ) (2020-05-05T11:08:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。