論文の概要: Distilling Facial Knowledge With Teacher-Tasks:
Semantic-Segmentation-Features For Pose-Invariant Face-Recognition
- arxiv url: http://arxiv.org/abs/2209.01115v1
- Date: Fri, 2 Sep 2022 15:24:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:32:19.667385
- Title: Distilling Facial Knowledge With Teacher-Tasks:
Semantic-Segmentation-Features For Pose-Invariant Face-Recognition
- Title(参考訳): 教師のタスクで顔の知識を蒸留する:セマンティックセグメンテーション--ポーズ不変な顔認識のための特徴
- Authors: Ali Hassani, Zaid El Shair, Rafi Ud Duala Refat, Hafiz Malik
- Abstract要約: 提案したSeg-Distilled-IDネットワークは、セグメンテーションタスクを「蒸留」する識別タスクとセグメンテーションタスクを共同で学習する。
パフォーマンスは、公開データセット上の最先端の3つのエンコーダに対してベンチマークされる。
実験により、Seg-Distilled-IDネットワークは、ResNet-101の81.6%、VGG-19の96.1%、InceptionV3の96.3%と比較して、99.9%のテスト精度を達成した。
- 参考スコア(独自算出の注目度): 1.1811442086145123
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper demonstrates a novel approach to improve face-recognition
pose-invariance using semantic-segmentation features. The proposed
Seg-Distilled-ID network jointly learns identification and
semantic-segmentation tasks, where the segmentation task is then "distilled"
(MobileNet encoder). Performance is benchmarked against three state-of-the-art
encoders on a publicly available data-set emphasizing head-pose variations.
Experimental evaluations show the Seg-Distilled-ID network shows notable
robustness benefits, achieving 99.9% test-accuracy in comparison to 81.6% on
ResNet-101, 96.1% on VGG-19 and 96.3% on InceptionV3. This is achieved using
approximately one-tenth of the top encoder's inference parameters. These
results demonstrate distilling semantic-segmentation features can efficiently
address face-recognition pose-invariance.
- Abstract(参考訳): 本稿では,セマンティクスセグメンテーション機能を用いた顔認識のポーズ非分散を改善するための新しいアプローチを提案する。
提案するSeg-Distilled-IDネットワークは,識別タスクとセグメンテーションタスクを共同で学習し,セグメンテーションタスクを "Distilled" (MobileNet encoder) する。
パフォーマンスは、3つの最先端エンコーダに対してベンチマークされる。
seg-distilled-idネットワークは、resnet-101の81.6%、vgg-19の96.1%、inceptionv3の96.3%と比較して、99.9%のテスト精度を達成している。
これはトップエンコーダの推論パラメータの約10分の1を使って達成される。
以上の結果から, 対面認識のポーズ不分散を効率的に解決できる, 蒸留用セマンティックセグメンテーション機能を示す。
関連論文リスト
- SmooSeg: Smoothness Prior for Unsupervised Semantic Segmentation [27.367986520072147]
教師なしセマンティックセグメンテーションは、手動のアノテーションなしでイメージをセマンティックグループに分割する難しいタスクである。
本研究では,SmooSegという手法を提案する。SmooSegは,観察中の近接性関係をスムーズな信号としてモデル化する自己教師付き学習手法である。
SmooSegは3つのデータセットのピクセル精度でSTEGOを著しく上回っている。
論文 参考訳(メタデータ) (2023-10-27T03:29:25Z) - Free-text Keystroke Authentication using Transformers: A Comparative
Study of Architectures and Loss Functions [1.0152838128195467]
キーストロークバイオメトリックスは、個人のタイピング行動におけるユニークなパターンを活用する、ユーザ識別と検証のための有望なアプローチである。
本稿では,キーストロークシーケンスから情報的特徴を抽出する自己注意型トランスフォーマーネットワークを提案する。
我々のモデルは、フリーテキストキーストローク認証における従来の最先端技術を上回る。
論文 参考訳(メタデータ) (2023-10-18T00:34:26Z) - PARTICLE: Part Discovery and Contrastive Learning for Fine-grained
Recognition [29.05343410791649]
本研究では,細粒度分類タスクやセグメント化タスクを自己監督的に表現する手法を開発した。
部分中心の学習ステップが画像内の部分の表現を集約し、コントラストすることを示す。
これにより、データセット間の画像分類と部分分割タスクのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-09-25T02:08:48Z) - Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild [97.14064057840089]
本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-17T19:25:28Z) - Segmentation of Weakly Visible Environmental Microorganism Images Using
Pair-wise Deep Learning Features [7.837413642215894]
本研究では,Pairwise Deep Learning Feature Network (PDLF-Net)を提案する。
PDLFを使用することで、各画像の対角深層学習機能をベースモデルのSegNetの異なるブロックに結合することにより、ネットワークはフォアグラウンド(EM)にもっと集中することができる。
PDLF-Netは89.24%、63.20%、77.27%、35.15%、89.72%、91.44%、89.30%という優れたセグメンテーション結果を達成する。
論文 参考訳(メタデータ) (2022-08-31T16:37:52Z) - TransFA: Transformer-based Representation for Face Attribute Evaluation [87.09529826340304]
我々はtextbfTransFA を用いたtextbfattribute 評価のための新しい textbf Transformer 表現を提案する。
提案するTransFAは,最先端手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-12T10:58:06Z) - Distilling Inter-Class Distance for Semantic Segmentation [17.76592932725305]
本稿では,教師ネットワークから学生ネットワークへ特徴空間内のクラス間距離を伝達するための,クラス間距離蒸留(IDD)手法を提案する。
本手法はセマンティックセグメンテーションモデルの精度の向上と最先端の性能向上に有効である。
論文 参考訳(メタデータ) (2022-05-07T13:13:55Z) - Toward Accurate and Reliable Iris Segmentation Using Uncertainty
Learning [96.72850130126294]
高精度で信頼性の高いアイリスセグメンテーションのためのアイリスU変換器(アイリスUsformer)を提案する。
IrisUsformerの精度向上のために,位置感応操作と再パッケージング変圧器ブロックを採用することで精巧に設計する。
IrisUsformer は SOTA IrisParseNet の 35% MAC を用いて, セグメンテーション精度の向上を図っている。
論文 参考訳(メタデータ) (2021-10-20T01:37:19Z) - Unsupervised Pretraining for Object Detection by Patch Reidentification [72.75287435882798]
教師なし表現学習は、オブジェクトディテクタの事前トレーニング表現で有望なパフォーマンスを実現します。
本研究では,オブジェクト検出のための簡易かつ効果的な表現学習手法であるパッチ再識別(Re-ID)を提案する。
私たちの方法は、トレーニングの反復やデータパーセンテージなど、すべての設定でCOCOの同等を大幅に上回ります。
論文 参考訳(メタデータ) (2021-03-08T15:13:59Z) - Three Ways to Improve Semantic Segmentation with Self-Supervised Depth
Estimation [90.87105131054419]
ラベルなし画像列からの自己教師付き単眼深度推定により強化された半教師付きセマンティックセマンティックセマンティックセマンティクスのフレームワークを提案する。
提案されたモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2020-12-19T21:18:03Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。