論文の概要: Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation
- arxiv url: http://arxiv.org/abs/2007.01771v2
- Date: Fri, 31 Dec 2021 11:00:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 05:46:50.241751
- Title: Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation
- Title(参考訳): 顔年齢に対するラベル分布の学習期待と魅力推定
- Authors: Bin-Bin Gao, Xin-Xin Liu, Hong-Yu Zhou, Jianxin Wu, Xin Geng
- Abstract要約: 本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
- 参考スコア(独自算出の注目度): 65.5880700862751
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial attributes (\eg, age and attractiveness) estimation performance has
been greatly improved by using convolutional neural networks. However, existing
methods have an inconsistency between the training objectives and the
evaluation metric, so they may be suboptimal. In addition, these methods always
adopt image classification or face recognition models with a large amount of
parameters, which carry expensive computation cost and storage overhead. In
this paper, we firstly analyze the essential relationship between two
state-of-the-art methods (Ranking-CNN and DLDL) and show that the Ranking
method is in fact learning label distribution implicitly. This result thus
firstly unifies two existing popular state-of-the-art methods into the DLDL
framework. Second, in order to alleviate the inconsistency and reduce resource
consumption, we design a lightweight network architecture and propose a unified
framework which can jointly learn facial attribute distribution and regress
attribute value. The effectiveness of our approach has been demonstrated on
both facial age and attractiveness estimation tasks. Our method achieves new
state-of-the-art results using the single model with 36$\times$ fewer
parameters and 3$\times$ faster inference speed on facial age/attractiveness
estimation. Moreover, our method can achieve comparable results as the
state-of-the-art even though the number of parameters is further reduced to
0.9M (3.8MB disk storage).
- Abstract(参考訳): 畳み込みニューラルネットワークを用いて顔の特徴(年齢、魅力)の推定性能を大幅に改善した。
しかし、既存の手法はトレーニング目標と評価基準との間に矛盾があるため、それらは準最適かもしれない。
さらに、これらの手法は常に大量のパラメータを持つ画像分類や顔認識モデルを採用しており、高価な計算コストとストレージオーバーヘッドを伴っている。
本稿では,まず2つの最先端手法( ranking-cnn と dldl)間の本質的関係を解析し,ランキング手法が実際にラベル分布を暗黙的に学習していることを示す。
これにより、まず2つの一般的な最先端メソッドをDLDLフレームワークに統合する。
第2に,不整合を緩和しリソース消費を減らすために,軽量ネットワークアーキテクチャを設計し,顔属性分布とレグレッシブ属性値を同時に学習可能な統一フレームワークを提案する。
提案手法の有効性は,顔の年齢と魅力評価の両課題において実証されている。
提案手法は,36$\times$パラメータを減らし,3$\times$パラメータを減らした単一モデルを用いて,顔の年齢/魅力推定における高速な推論速度を実現する。
さらに,パラメータの数を0.9M (3.8MB) に削減した場合でも,最先端技術と同等の結果が得られる。
関連論文リスト
- Toward Fair Facial Expression Recognition with Improved Distribution
Alignment [19.442685015494316]
本稿では,表情認識(FER)モデルにおけるバイアスを軽減する新しい手法を提案する。
本手法は、FERモデルによる埋め込みにおいて、性別、年齢、人種などの機密属性情報を低減することを目的としている。
ferモデルにおいて、魅力の概念を重要な感度属性として分析し、FERモデルがより魅力的な顔に対するバイアスを実際に示できることを実証する。
論文 参考訳(メタデータ) (2023-06-11T14:59:20Z) - Lightweight Facial Attractiveness Prediction Using Dual Label Distribution [16.60169799392108]
顔の魅力予測(FAP)は、人間の美的知覚に基づいて顔の魅力を自動的に評価することを目的としている。
両ラベル分布と軽量設計を統合した新しいエンドツーエンドFAP手法を提案する。
提案手法は有望な結果を達成し,性能と効率のバランスをとることに成功している。
論文 参考訳(メタデータ) (2022-12-04T04:19:36Z) - Deep Active Ensemble Sampling For Image Classification [8.31483061185317]
アクティブラーニングフレームワークは、最も有益なデータポイントのラベル付けを積極的に要求することで、データアノテーションのコストを削減することを目的としている。
提案手法には、不確実性に基づく手法、幾何学的手法、不確実性に基づく手法と幾何学的手法の暗黙の組み合わせなどがある。
本稿では, サンプル選択戦略における効率的な探索・探索トレードオフを実現するために, 不確実性に基づくフレームワークと幾何学的フレームワークの両方の最近の進歩を革新的に統合する。
本フレームワークは,(1)正確な後続推定,(2)計算オーバーヘッドと高い精度のトレードオフの2つの利点を提供する。
論文 参考訳(メタデータ) (2022-10-11T20:20:20Z) - Powerpropagation: A sparsity inducing weight reparameterisation [65.85142037667065]
我々は、本質的にスパースモデルにつながるニューラルネットワークの新しい重みパラメータ化であるPowerpropagationを紹介した。
この方法で訓練されたモデルは同様の性能を示すが、0で明らかに高い密度の分布を持ち、より多くのパラメータを安全に刈り取ることができる。
ここでは、Powerpropagationと従来のウェイトプルーニング技術と、最近の最先端スパース・トゥ・スパースアルゴリズムを組み合わせることで、ImageNetベンチマークで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-01T10:03:57Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Active Learning for Deep Object Detection via Probabilistic Modeling [27.195742892250916]
オブジェクト検出のための新しい深層アクティブラーニング手法を提案する。
提案手法は,各局所化および分類ヘッドの出力に対する確率分布を推定する混合密度ネットワークに依存する。
本手法では,両頭部の2種類の不確実性を集約したスコアリング関数を用いて,各画像のインフォラティブネススコアを求める。
論文 参考訳(メタデータ) (2021-03-30T07:37:11Z) - Modeling Score Distributions and Continuous Covariates: A Bayesian
Approach [8.772459063453285]
連続共変量に対するマッチングと非マッチスコア分布の生成モデルを構築した。
混合モデルを用いて任意の分布と局所基底関数をキャプチャする。
提案手法の精度と有効性を示す3つの実験を行った。
論文 参考訳(メタデータ) (2020-09-21T02:41:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。