論文の概要: Trading-off Mutual Information on Feature Aggregation for Face
Recognition
- arxiv url: http://arxiv.org/abs/2309.13137v1
- Date: Fri, 22 Sep 2023 18:48:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 22:05:58.974464
- Title: Trading-off Mutual Information on Feature Aggregation for Face
Recognition
- Title(参考訳): 顔認識のための特徴集約に関する相互情報交換
- Authors: Mohammad Akyash, Ali Zafari, Nasser M. Nasrabadi
- Abstract要約: 本稿では、2つの最先端(SOTA)深層顔認識(FR)モデルの出力を集約する手法を提案する。
提案手法では,2つの特徴写像の異なる部分間の関係を利用するために,変圧器の注意機構を利用する。
提案手法の有効性を評価するため,一般的なベンチマーク実験を行い,その結果を最先端のアルゴリズムと比較した。
- 参考スコア(独自算出の注目度): 12.803514943105657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the advances in the field of Face Recognition (FR), the precision of
these methods is not yet sufficient. To improve the FR performance, this paper
proposes a technique to aggregate the outputs of two state-of-the-art (SOTA)
deep FR models, namely ArcFace and AdaFace. In our approach, we leverage the
transformer attention mechanism to exploit the relationship between different
parts of two feature maps. By doing so, we aim to enhance the overall
discriminative power of the FR system. One of the challenges in feature
aggregation is the effective modeling of both local and global dependencies.
Conventional transformers are known for their ability to capture long-range
dependencies, but they often struggle with modeling local dependencies
accurately. To address this limitation, we augment the self-attention mechanism
to capture both local and global dependencies effectively. This allows our
model to take advantage of the overlapping receptive fields present in
corresponding locations of the feature maps. However, fusing two feature maps
from different FR models might introduce redundancies to the face embedding.
Since these models often share identical backbone architectures, the resulting
feature maps may contain overlapping information, which can mislead the
training process. To overcome this problem, we leverage the principle of
Information Bottleneck to obtain a maximally informative facial representation.
This ensures that the aggregated features retain the most relevant and
discriminative information while minimizing redundant or misleading details. To
evaluate the effectiveness of our proposed method, we conducted experiments on
popular benchmarks and compared our results with state-of-the-art algorithms.
The consistent improvement we observed in these benchmarks demonstrates the
efficacy of our approach in enhancing FR performance.
- Abstract(参考訳): 顔認識(FR)分野の進歩にもかかわらず、これらの手法の精度はまだ十分ではない。
本稿では, FRの性能向上のために, 最先端(SOTA)深部FRモデルであるArcFaceとAdaFaceの出力を集約する手法を提案する。
提案手法では,トランスフォーマーアテンション機構を利用して2つの特徴マップの異なる部分間の関係を利用する。
これにより、FRシステムの全体的な識別能力を高めることを目指している。
機能集約の課題の1つは、ローカルとグローバル両方の依存関係を効果的にモデリングすることである。
従来のトランスフォーマーは、長距離依存関係をキャプチャする能力で知られているが、しばしばローカル依存関係を正確にモデル化するのに苦労する。
この制限に対処するため、ローカルとグローバルの両方の依存関係を効果的にキャプチャする自己認識機構を増強する。
これにより、我々のモデルは、機能マップの対応する場所に存在する重複する受容フィールドを利用することができます。
しかし、異なるfrモデルの2つの特徴マップを融合することは、顔埋め込みに冗長性をもたらすかもしれない。
これらのモデルはしばしば同一のバックボーンアーキテクチャを共有するため、得られた特徴マップには重複した情報が含まれ、トレーニングプロセスを誤解させる可能性がある。
この問題を克服するために,我々はインフォメーション・ボトルネックの原理を利用して,最大情報的表情を求める。
これにより、集約された特徴が最も関連性があり差別的な情報を保持しつつ、冗長または誤解を招く詳細を最小限に抑えることができる。
提案手法の有効性を評価するため,人気のあるベンチマーク実験を行い,最先端アルゴリズムと比較した。
これらのベンチマークで観測した一貫した改善は、fr性能向上における我々のアプローチの有効性を示しています。
関連論文リスト
- FedDr+: Stabilizing Dot-regression with Global Feature Distillation for Federated Learning [27.782676760198697]
フェデレートラーニング(FL)は、効果的なグローバルモデル開発のための重要なフレームワークとして登場した。
FLの主な課題はクライアントのドリフトであり、データの不均一性は分散した知識の集約を妨げる。
我々は,ドット回帰損失を用いた局所モデルアライメントを実現するFedDr+という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-04T14:34:13Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - Feature Decoupling-Recycling Network for Fast Interactive Segmentation [79.22497777645806]
近年のインタラクティブセグメンテーション手法では,入力としてソースイメージ,ユーザガイダンス,従来予測されていたマスクを反復的に取り込んでいる。
本稿では,本質的な相違点に基づいてモデリングコンポーネントを分離するFDRN(Feature Decoupling-Recycling Network)を提案する。
論文 参考訳(メタデータ) (2023-08-07T12:26:34Z) - CoNAN: Conditional Neural Aggregation Network For Unconstrained Face
Feature Fusion [11.059590443280726]
テンプレートアグリゲーションのためのCoNANと呼ばれる特徴分散条件付け手法を提案する。
具体的には,受信した特徴集合の分布情報から条件付きコンテキストベクトルを学習することを目的としている。
提案手法は、長距離非拘束顔認識データセットの最先端結果を生成する。
論文 参考訳(メタデータ) (2023-07-16T09:47:21Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Local Similarity Pattern and Cost Self-Reassembling for Deep Stereo
Matching Networks [3.7384509727711923]
LSP(Local similarity Pattern)という,深層ステレオマッチングネットワークのためのペア機能を導入する。
隣接する関係を明確に明らかにすることで、LSPはより識別的な特徴記述を支援するために活用できる豊富な構造情報を含んでいる。
第2に,動的自己組み換え改良戦略を設計し,コスト分布と分散マップにそれぞれ適用する。
論文 参考訳(メタデータ) (2021-12-02T06:52:54Z) - Light Field Saliency Detection with Dual Local Graph Learning
andReciprocative Guidance [148.9832328803202]
我々は、グラフネットワークを介して焦点スタック内のインフォメーション融合をモデル化する。
我々は、全焦点パタンを用いて焦点スタック融合過程をガイドする新しいデュアルグラフモデルを構築した。
論文 参考訳(メタデータ) (2021-10-02T00:54:39Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Video Salient Object Detection via Adaptive Local-Global Refinement [7.723369608197167]
ビデオ・サリエント・オブジェクト検出(VSOD)は多くの視覚アプリケーションにおいて重要な課題である。
vsodのための適応型局所的グローバルリファインメントフレームワークを提案する。
重み付け手法は特徴相関を更に活用し,ネットワークにより識別的な特徴表現を学習させることができることを示す。
論文 参考訳(メタデータ) (2021-04-29T14:14:11Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Relational Deep Feature Learning for Heterogeneous Face Recognition [17.494718795454055]
一般的な顔の特徴に加えて,グローバルな関係情報を抽出するグラフモジュール (Graph Module, NIR) を提案する。
提案手法は,5つの異種顔認識(HFR)データベースにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-02T07:35:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。