Fugu-MT 論文翻訳(概要): QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition

論文の概要: QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition

arxiv url: http://arxiv.org/abs/2411.01988v2
Date: Wed, 18 Dec 2024 08:51:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-19 16:46:51.897723
Title: QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition
Title（参考訳）: QCS:顔の表情認識のための四肢交叉類似性からの精細化
Authors: Chengpeng Wang, Li Chen, Lili Wang, Zhaofan Li, Xuebin Lv,
Abstract要約: 画像ペアからよりリッチな固有情報をマイニングするために、Cross similarity Attentionを導入する。我々は、勾配競合を緩和する4分岐中央対称ネットワーク、Quadruplet Cross similarity (QCS) を設計する。提案手法は,複数のFERデータセット上での最先端性能を実現する。
参考スコア（独自算出の注目度）: 17.7824127337701
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Facial expression recognition faces challenges where labeled significant features in datasets are mixed with unlabeled redundant ones. In this paper, we introduce Cross Similarity Attention (CSA) to mine richer intrinsic information from image pairs, overcoming a limitation when the Scaled Dot-Product Attention of ViT is directly applied to calculate the similarity between two different images. Based on CSA, we simultaneously minimize intra-class differences and maximize inter-class differences at the fine-grained feature level through interactions among multiple branches. Contrastive residual distillation is utilized to transfer the information learned in the cross module back to the base network. We ingeniously design a four-branch centrally symmetric network, named Quadruplet Cross Similarity (QCS), which alleviates gradient conflicts arising from the cross module and achieves balanced and stable training. It can adaptively extract discriminative features while isolating redundant ones. The cross-attention modules exist during training, and only one base branch is retained during inference, resulting in no increase in inference time. Our proposed method achieves state-of-the-art performance on several FER datasets.
Abstract（参考訳）: 顔の表情認識は、ラベル付きデータセットに重要な特徴がラベル付けされていない冗長な特徴と混ざり合っているという課題に直面している。本稿では,2つの画像間の類似性を計算するために,ViTのスケールド・プロダクティヴ・アテンションを直接適用した場合の制限を克服するため,画像対からよりリッチな固有情報をマイニングするクロス・類似性アテンション(CSA)を導入する。 CSAに基づいて,複数の枝間の相互作用を通じて,クラス内差を最小化し,粒度の細かい特徴レベルでクラス間差を最大化する。コントラスト残留蒸留を用いて、クロスモジュールで学んだ情報をベースネットワークに転送する。クロスモジュールから発生する勾配の衝突を緩和し、バランスよく安定したトレーニングを実現する4分岐中央対称ネットワーク、Quadruplet Cross similarity (QCS) を創発的に設計する。冗長な特徴を分離しながら、識別的特徴を適応的に抽出することができる。クロスアテンションモジュールはトレーニング中に存在し、推論中に1つのベースブランチのみが保持されるため、推論時間が増加しない。提案手法は,複数のFERデータセット上での最先端性能を実現する。

関連論文リスト

Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。 MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。 MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文参考訳（メタデータ） (2025-01-18T11:57:20Z)
Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID [57.500045584556794]
均質かつ不均一なインスタンスレベルの構造を同時に説明できるModality-Unified Label Transfer (MULT) モジュールを導入する。提案したMULTは、生成した擬似ラベルがモダリティ間の整合性を維持しつつ、モダリティ内の構造的整合性を維持することを保証する。実験の結果,提案手法は既存のUSL-VI-ReID法よりも優れていた。
論文参考訳（メタデータ） (2024-02-01T15:33:17Z)
Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.573905143954015]
本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2023-05-22T03:27:46Z)
Decoupled Multi-task Learning with Cyclical Self-Regulation for Face Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-03-28T02:12:30Z)
CAD: Co-Adapting Discriminative Features for Improved Few-Shot Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文参考訳（メタデータ） (2022-03-25T06:14:51Z)
Relational Embedding for Few-Shot Classification [32.12002195421671]
本稿では,メタラーニング(メタラーニング)の「観察すべきもの」と「出席すべき場所」をリレーショナルな視点で扱うことで,数発分類の問題に対処することを提案する。我々の手法は自己相関表現(SCR)と相互相関注意(CCA)を通して画像内および画像間のパターンを利用する。私たちの埋め込みネットワーク(RENet)は2つのリレーショナルモジュールを組み合わせて、エンドツーエンドでリレーショナル埋め込みを学習します。
論文参考訳（メタデータ） (2021-08-22T08:44:55Z)
Dual-Cross Central Difference Network for Face Anti-Spoofing [54.81222020394219]
対面防止(FAS)は、顔認識システムを保護する上で重要な役割を担っている。中央差分畳み込み(CDC)は、FASタスクの優れた表現能力を示しています。中心と周囲の局所的な特徴の差を利用した2つのC-CDC(Cross Central difference Convolutions)を提案する。
論文参考訳（メタデータ） (2021-05-04T05:11:47Z)
Cross-Level Cross-Scale Cross-Attention Network for Point Cloud Representation [8.76786786874107]
最近、自然言語処理(NLP)と画像処理領域の顕著な進歩を達成した自己保持メカニズム。ポイントクラウド表現学習のためのクロスレベルクロススケールクロスアテンションネットワーク(CLCSCANet)と呼ばれるエンドツーエンドアーキテクチャを提案する。
論文参考訳（メタデータ） (2021-04-27T09:01:14Z)
CrossATNet - A Novel Cross-Attention Based Framework for Sketch-Based Image Retrieval [30.249581102239645]
スケッチベース画像検索(SBIR)の文脈におけるZSL(クロスモーダル・ゼロショット・ラーニング)のための新しいフレームワークを提案する。共有空間の識別性を確保するためにクロスモーダル三重項損失を定義する一方で、画像領域から特徴抽出を導くための革新的なクロスモーダル注意学習戦略も提案されている。
論文参考訳（メタデータ） (2021-04-20T12:11:12Z)
Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。既存のほとんどの方法は個々の画像のみを入力とする。そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文参考訳（メタデータ） (2021-01-21T10:19:02Z)
Robust Facial Landmark Detection by Cross-order Cross-semantic Deep Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文参考訳（メタデータ） (2020-11-16T08:19:26Z)
Symbiotic Adversarial Learning for Attribute-based Person Search [86.7506832053208]
本稿では,共生学習の枠組みとして,共生学習の基盤に2つのGANを配置する。具体的には、2種類の生成的敵ネットワークがトレーニングプロセスを通して協調的に学習する。
論文参考訳（メタデータ） (2020-07-19T07:24:45Z)
Self-Challenging Improves Cross-Domain Generalization [81.99554996975372]
畳み込みニューラルネットワーク(CNN)は、ラベルと相関する支配的特徴を活性化することにより、画像分類を行う。ドメイン外データに対するCNNの一般化を著しく改善する簡単なトレーニングである自己整合表現(RSC)を導入する。 RSCはトレーニングデータ上で活性化される主要な機能に対して反復的に挑戦し、ラベルと相関する残りの機能を有効にするようネットワークに強制する。
論文参考訳（メタデータ） (2020-07-05T21:42:26Z)
ReMarNet: Conjoint Relation and Margin Learning for Small-Sample Image Classification [49.87503122462432]
ReMarNet(Relation-and-Margin Learning Network)と呼ばれるニューラルネットワークを導入する。本手法は,上記2つの分類機構の双方において優れた性能を発揮する特徴を学習するために,異なるバックボーンの2つのネットワークを組み立てる。 4つの画像データセットを用いた実験により,本手法はラベル付きサンプルの小さな集合から識別的特徴を学習するのに有効であることが示された。
論文参考訳（メタデータ） (2020-06-27T13:50:20Z)
Multi-Margin based Decorrelation Learning for Heterogeneous Face Recognition [90.26023388850771]
本稿では,超球面空間におけるデコリレーション表現を抽出するディープニューラルネットワーク手法を提案する。提案するフレームワークは,不均一表現ネットワークとデコリレーション表現学習の2つのコンポーネントに分けることができる。 2つの難解な異種顔データベースに対する実験結果から,本手法は検証タスクと認識タスクの両方において優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2020-05-25T07:01:12Z)
ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文参考訳（メタデータ） (2020-04-19T20:40:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。