論文の概要: Recent Advances in Deep Learning Techniques for Face Recognition
- arxiv url: http://arxiv.org/abs/2103.10492v1
- Date: Thu, 18 Mar 2021 19:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 14:45:51.704336
- Title: Recent Advances in Deep Learning Techniques for Face Recognition
- Title(参考訳): 顔認識のためのディープラーニング技術の最近の進歩
- Authors: Md. Tahmid Hasan Fuad, Awal Ahmed Fime, Delowar Sikder, Md. Akil
Raihan Iftee, Jakaria Rabbi, Mabrook S. Al-rakhami, Abdu Gumae, Ovishake Sen,
Mohtasim Fuad, and Md. Nazrul Islam
- Abstract要約: 本稿では,異なるタイプの深層学習(DL)技術を活用する様々な顔認識(FR)システムについて包括的に分析する。
本稿では,様々なアルゴリズム,アーキテクチャ,損失関数,アクティベーション関数,データセット,課題,改善アイデア,dlベースのfrシステムの現状と将来動向について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, researchers have proposed many deep learning (DL) methods
for various tasks, and particularly face recognition (FR) made an enormous leap
using these techniques. Deep FR systems benefit from the hierarchical
architecture of the DL methods to learn discriminative face representation.
Therefore, DL techniques significantly improve state-of-the-art performance on
FR systems and encourage diverse and efficient real-world applications. In this
paper, we present a comprehensive analysis of various FR systems that leverage
the different types of DL techniques, and for the study, we summarize 168
recent contributions from this area. We discuss the papers related to different
algorithms, architectures, loss functions, activation functions, datasets,
challenges, improvement ideas, current and future trends of DL-based FR
systems. We provide a detailed discussion of various DL methods to understand
the current state-of-the-art, and then we discuss various activation and loss
functions for the methods. Additionally, we summarize different datasets used
widely for FR tasks and discuss challenges related to illumination, expression,
pose variations, and occlusion. Finally, we discuss improvement ideas, current
and future trends of FR tasks.
- Abstract(参考訳): 近年、研究者は様々なタスクのための多くのディープラーニング(dl)手法を提案しており、特に顔認識(fr)はこれらの手法を用いて大きな飛躍を遂げている。
深いFRシステムは、差別的な顔表現を学ぶためのDL法の階層的アーキテクチャの恩恵を受ける。
したがって、DL技術はFRシステムの最先端性能を大幅に改善し、多種多様な実世界の応用を促進する。
本稿では,様々な種類のdl技術を活用した様々なfrシステムの包括的解析を行い,この領域からの最近の168の貢献を要約する。
本稿では,様々なアルゴリズム,アーキテクチャ,損失関数,アクティベーション関数,データセット,課題,改善アイデア,dlベースのfrシステムの現状と将来動向について述べる。
本稿では,現在の技術状況を理解するための様々なDL手法の詳細な議論を行い,その方法の活性化と損失関数について論じる。
さらに,frタスクに広く使用されているデータセットを要約し,照明,表情,ポーズ変動,咬合に関する課題について考察した。
最後に,frタスクの改善アイデア,現在と将来について考察する。
関連論文リスト
- MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Improved Baselines for Data-efficient Perceptual Augmentation of LLMs [66.05826802808177]
コンピュータビジョンでは、画像キャプションや視覚的質問応答などの視覚言語タスクに、大きな言語モデル(LLM)を用いることができる。
複数のタスクにまたがる異なる対面機構を実験的に評価する。
異なるタスク間で(ほぼ)最適な結果をもたらす新しいインターフェース機構を同定し、トレーニング時間を4倍短縮する。
論文 参考訳(メタデータ) (2024-03-20T10:57:17Z) - A Data Generation Perspective to the Mechanism of In-Context Learning [37.933016939520684]
In-Context Learning (ICL)は、大規模言語モデル(LLM)にコンテキストで学習する能力を与える。
経験的成功を奨励するにもかかわらず、ICLの基盤となるメカニズムは未だ不明である。
論文 参考訳(メタデータ) (2024-02-03T17:13:03Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Survey on Deep Face Restoration: From Non-blind to Blind and Beyond [79.1398990834247]
顔復元(FR)は、低品質 (LQ) の顔画像を高品質 (HQ) の顔画像に復元することを目的とした、画像復元の専門分野である。
近年のディープラーニング技術の進歩はFR法に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2023-09-27T08:39:03Z) - Adaptive Feature Fusion: Enhancing Generalization in Deep Learning
Models [0.0]
本稿では,ディープラーニングモデルの一般化を促進するために,アダプティブ・フィーチャー・フュージョン(Adaptive Feature Fusion, AFF)を提案する。
AFFは、基礎となるデータ特性とモデル要件に基づいて、機能を適応的にフューズすることができる。
この分析は、一般化能力の向上におけるAFFの有効性を示し、様々なタスクやアプリケーションのパフォーマンスを改善した。
論文 参考訳(メタデータ) (2023-04-04T21:41:38Z) - Hierarchical Optimization-Derived Learning [58.69200830655009]
我々は,最適化モデル構築の本質的な動作とそれに対応する学習過程を同時に研究するために,階層型ODL(Hyerarchical ODL)という新しいフレームワークを構築した。
これは、最適化と学習という2つの結合されたODLコンポーネントに対する最初の理論的保証である。
論文 参考訳(メタデータ) (2023-02-11T03:35:13Z) - Systems for Parallel and Distributed Large-Model Deep Learning Training [7.106986689736828]
最近のTransformerモデルは、数十億の学習可能なパラメータにまたがっている。
これらの設計はDL空間に新たなスケール駆動システム課題をもたらした。
この調査では、大規模なモデルトレーニングシステムの展望を探求し、主要な課題とそれに対応する様々なテクニックを強調します。
論文 参考訳(メタデータ) (2023-01-06T19:17:29Z) - Deep Transform and Metric Learning Networks [30.753361147185995]
本稿では,リニア層とリカレントニューラルネットワークの組み合わせとして,各dl層を定式化し,解くことができる新しい深層dl手法を提案する。
ニューラル・ネットワークとディープ・DLの新たな知見を明らかにし、ディープ・トランスフォーメーションとメトリクスを共同学習する斬新で効率的で競争的なアプローチを提供します。
論文 参考訳(メタデータ) (2021-04-21T03:10:15Z) - Semantic-aware Knowledge Distillation for Few-Shot Class-Incremental
Learning [32.52270964066876]
少数のショットクラスインクリメンタルラーニング(FSCIL)は、新しい概念を徐々に学習する問題を示しています。
FSCILの問題に対処するための蒸留アルゴリズムを導入し、トレーニング中に意味情報の活用を提案する。
論文 参考訳(メタデータ) (2021-03-06T08:07:26Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。