論文の概要: Facial Landmark Points Detection Using Knowledge Distillation-Based
Neural Networks
- arxiv url: http://arxiv.org/abs/2111.07047v1
- Date: Sat, 13 Nov 2021 05:45:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 11:33:15.677756
- Title: Facial Landmark Points Detection Using Knowledge Distillation-Based
Neural Networks
- Title(参考訳): 知識蒸留型ニューラルネットワークによる顔のランドマーク点検出
- Authors: Ali Pourramezan Fard, Mohammad H. Mahoor
- Abstract要約: 本稿では,顔のランドマーク検出のための軽量な学生ネットワークを訓練するための新しい損失関数を提案する。
我々は,2つの教員ネットワーク,トレラント・Teacher と Tough-Teacher を学生ネットワークと組み合わせて利用する。
実験結果から,提案したアーキテクチャにより,より高精度な学習ネットワークが実現されることが示唆された。
- 参考スコア(独自算出の注目度): 5.665283675533069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial landmark detection is a vital step for numerous facial image analysis
applications. Although some deep learning-based methods have achieved good
performances in this task, they are often not suitable for running on mobile
devices. Such methods rely on networks with many parameters, which makes the
training and inference time-consuming. Training lightweight neural networks
such as MobileNets are often challenging, and the models might have low
accuracy. Inspired by knowledge distillation (KD), this paper presents a novel
loss function to train a lightweight Student network (e.g., MobileNetV2) for
facial landmark detection. We use two Teacher networks, a Tolerant-Teacher and
a Tough-Teacher in conjunction with the Student network. The Tolerant-Teacher
is trained using Soft-landmarks created by active shape models, while the
Tough-Teacher is trained using the ground truth (aka Hard-landmarks) landmark
points. To utilize the facial landmark points predicted by the Teacher
networks, we define an Assistive Loss (ALoss) for each Teacher network.
Moreover, we define a loss function called KD-Loss that utilizes the facial
landmark points predicted by the two pre-trained Teacher networks
(EfficientNet-b3) to guide the lightweight Student network towards predicting
the Hard-landmarks. Our experimental results on three challenging facial
datasets show that the proposed architecture will result in a better-trained
Student network that can extract facial landmark points with high accuracy.
- Abstract(参考訳): 顔のランドマーク検出は多くの顔画像解析アプリケーションにとって重要なステップである。
いくつかのディープラーニングベースの手法はこのタスクで優れたパフォーマンスを達成したが、モバイルデバイス上での実行には適していないことが多い。
このような手法は多くのパラメータを持つネットワークに依存しており、トレーニングと推論に時間がかかる。
MobileNetsのような軽量ニューラルネットワークのトレーニングは、しばしば困難であり、モデルの精度は低い。
本稿では,知識蒸留(kd)に触発されて,顔ランドマーク検出のための軽量な学生ネットワーク(mobilenetv2)を訓練する新しい損失関数を提案する。
我々は,2つの教員ネットワーク,トレラント・Teacher と Tough-Teacher を学生ネットワークと組み合わせて利用する。
Tolerant-Teacherはアクティブな形状モデルによって作成されたソフトランドマークを使って訓練され、Tough-Teacherは地上の真実(別名ハードランドマーク)のランドマークを使って訓練される。
教師ネットワークによって予測される顔のランドマークポイントを利用するために,教師ネットワーク毎に補助損失(ALoss)を定義する。
さらに,2つの教員ネットワーク(EfficientNet-b3)によって予測される顔のランドマークを利用したKD-Lossと呼ばれる損失関数を定義し,学生ネットワークをハードランドマークの予測に向けて誘導する。
3つの難解な顔データセットを用いた実験結果から,提案手法は,高い精度で顔ランドマーク点を抽出できる,より訓練された学生ネットワークを実現する。
関連論文リスト
- Self-supervised cross-modality learning for uncertainty-aware object detection and recognition in applications which lack pre-labelled training data [6.892494758401737]
我々は、不確実性を認識したディープニューラルネットワークが2次元RGB画像中の物体を検出し、認識し、ローカライズするためにどのように訓練されるかを示す。
本手法は,ラベル付きデータセットが一般に利用できない,多くの重要な産業タスクに適用可能である。
論文 参考訳(メタデータ) (2024-11-05T13:26:31Z) - Knowledge Distillation on Spatial-Temporal Graph Convolutional Network for Traffic Prediction [3.0450307343472405]
複雑なネットワーク(教師)からの蒸留データを用いて、より少ないパラメータ(学生)でネットワークを訓練するコスト関数を導入する。
我々は,教師ネットワークから空間時間相関を取り入れた知識蒸留を用いて,教師が知覚する複雑なパターンを学習できるようにする。
本手法は,ネットワークパラメータのわずか3%を保持しても,教師の精度に近い精度を維持することができる。
論文 参考訳(メタデータ) (2024-01-22T09:54:49Z) - MOS: A Low Latency and Lightweight Framework for Face Detection,
Landmark Localization, and Head Pose Estimation [37.537102697992395]
顔検出,ランドマークの定位,頭部ポーズ推定を同時に行うために,低レイテンシで軽量なネットワークを提案する。
大きな角度の顔のランドマークを見つけることがより困難であるという観察に刺激され、学習を制限するためにポーズロスが提案される。
また,各タスクの重みを自動的に学習するために,不確実なマルチタスク損失を提案する。
論文 参考訳(メタデータ) (2021-10-21T08:05:53Z) - Deep Structured Instance Graph for Distilling Object Detectors [82.16270736573176]
本稿では,検出システム内の情報を利用して,検出知識の蒸留を容易にするための簡単な知識構造を提案する。
我々は,1段と2段の両方の検出器上で,多様な学生-教師ペアによるCOCOオブジェクト検出の課題に対して,新しい最先端の成果を達成した。
論文 参考訳(メタデータ) (2021-09-27T08:26:00Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Multi-Agent Semi-Siamese Training for Long-tail and Shallow Face
Learning [54.13876727413492]
多くの現実世界の顔認識シナリオでは、トレーニングデータセットの深さは浅いため、IDごとに2つの顔画像しか利用できません。
非均一なサンプルの増加により、このような問題はより一般的なケース、すなわち長い尾の顔学習に変換される。
これらの問題に対処するために,マルチエージェントセミシアントレーニング(masst)という高度なソリューションを導入する。
広範な実験と比較は、長い尾と浅い顔学習のためのMASSTの利点を示しています。
論文 参考訳(メタデータ) (2021-05-10T04:57:32Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Point Adversarial Self Mining: A Simple Method for Facial Expression
Recognition [79.75964372862279]
本稿では,表情認識における認識精度を向上させるために,PASM(Point Adversarial Self Mining)を提案する。
PASMは、目標タスクに関連する最も情報性の高い位置を見つけるために、ポイント敵攻撃法と訓練された教師ネットワークを使用する。
適応学習教材の生成と教師/学生の更新を複数回行うことができ、ネットワーク能力が反復的に向上する。
論文 参考訳(メタデータ) (2020-08-26T06:39:24Z) - Learning Error-Driven Curriculum for Crowd Counting [13.654369353905329]
そこで本研究では,本ネットワークのトレーニングを補助する追加のネットワークを用いて,エラー駆動型カリキュラムを学習するための新しい学習戦略を提案する。
TutorNetと呼ばれるチューターネットワークは、メインネットワークの致命的なエラーを反復的に示すために提案されている。
論文 参考訳(メタデータ) (2020-07-19T14:18:55Z) - MarginDistillation: distillation for margin-based softmax [0.913755431537592]
エッジデバイスのための顔識別タスクのために、マージンベースのソフトマックスでトレーニングされた軽量ニューラルネットワークモデルが導入された。
本稿では,顔認識タスクにおける他の既知の手法よりも優れた,軽量ニューラルネットワークアーキテクチャのための新しい蒸留手法を提案する。
論文 参考訳(メタデータ) (2020-03-05T13:03:23Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。