論文の概要: Lightweight Facial Attractiveness Prediction Using Dual Label
Distribution
- arxiv url: http://arxiv.org/abs/2212.01742v1
- Date: Sun, 4 Dec 2022 04:19:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 17:05:34.002533
- Title: Lightweight Facial Attractiveness Prediction Using Dual Label
Distribution
- Title(参考訳): デュアルラベル分布を用いた軽量顔魅力予測
- Authors: Shu Liu, Enquan Huang, Yan Xu, Kexuan Wang, Xiaoyan Kui, Tao Lei,
Hongying Meng
- Abstract要約: 顔の魅力予測(FAP)は、人間の美的知覚に基づいて顔の魅力を自動的に評価することを目的としている。
両ラベル分布と軽量設計を統合した新しいエンドツーエンドFAP手法を提案する。
当社のアプローチは有望な結果を達成し、パフォーマンスと効率のバランスをとることに成功しています。
- 参考スコア(独自算出の注目度): 16.839864888370872
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Facial attractiveness prediction (FAP) aims to assess the facial
attractiveness automatically based on human aesthetic perception. Previous
methods using deep convolutional neural networks have boosted the performance,
but their giant models lead to a deficiency in flexibility. Besides, most of
them fail to take full advantage of the dataset. In this paper, we present a
novel end-to-end FAP approach integrating dual label distribution and
lightweight design. To make the best use of the dataset, the manual ratings,
attractiveness score, and standard deviation are aggregated explicitly to
construct a dual label distribution, including the attractiveness distribution
and the rating distribution. Such distributions, as well as the attractiveness
score, are optimized under a joint learning framework based on the label
distribution learning (LDL) paradigm. As for the lightweight design, the data
processing is simplified to minimum, and MobileNetV2 is selected as our
backbone. Extensive experiments are conducted on two benchmark datasets, where
our approach achieves promising results and succeeds in striking a balance
between performance and efficiency. Ablation studies demonstrate that our
delicately designed learning modules are indispensable and correlated.
Additionally, the visualization indicates that our approach is capable of
perceiving facial attractiveness and capturing attractive facial regions to
facilitate semantic predictions.
- Abstract(参考訳): 顔の魅力予測(FAP)は、人間の美的知覚に基づいて顔の魅力を自動的に評価することを目的としている。
ディープ畳み込みニューラルネットワークを使った従来の手法では性能が向上したが、その巨大なモデルは柔軟性の欠如につながった。
さらに、その多くはデータセットのフル活用に失敗しています。
本稿では,両ラベル分布と軽量設計を統合した新しいエンドツーエンドFAP手法を提案する。
データセットを最大限に利用するために、手動のレーティング、魅力スコア、標準偏差を明示的に集計して、魅力分布及び評価分布を含む二重ラベル分布を構成する。
このような分布と魅力スコアは、ラベル分布学習(ldl)パラダイムに基づいた共同学習枠組みに基づいて最適化されている。
軽量な設計では、データ処理を最小限に単純化し、MobileNetV2をバックボーンとして選択します。
2つのベンチマークデータセットで広範な実験が行われ、このアプローチは有望な結果を達成し、パフォーマンスと効率のバランスを取ることに成功しています。
アブレーション研究は、繊細に設計された学習モジュールが不可欠で相関していることを示している。
さらに, この手法は, 顔の魅力を知覚し, 魅力ある顔領域を捉え, セマンティックな予測を容易にすることができることを示す。
関連論文リスト
- LPLgrad: Optimizing Active Learning Through Gradient Norm Sample Selection and Auxiliary Model Training [2.762397703396293]
LPLgrad(Loss Prediction Loss with Gradient Norm)は、モデルの不確実性を効果的に定量化し、画像分類タスクの精度を向上させる。
LPLgradは2つの異なるフェーズで動作する: (i) Em Training Phaseは、メインモデルと補助モデルとを併用して入力特徴の損失を予測することを目的としている。
この二重モデルアプローチは、複雑な入力特徴を抽出し、データから本質的なパターンを効果的に学習する能力を高める。
論文 参考訳(メタデータ) (2024-11-20T18:12:59Z) - Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - DIVE: Subgraph Disagreement for Graph Out-of-Distribution Generalization [44.291382840373]
本稿では,グラフ機械学習におけるアウト・オブ・ディストリビューションの一般化の課題に対処する。
従来のグラフ学習アルゴリズムは、この仮定が失敗する現実世界のシナリオで失敗する。
この準最適性能に寄与する主な要因は、ニューラルネットワークの本質的な単純さバイアスである。
論文 参考訳(メタデータ) (2024-08-08T12:08:55Z) - Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。
学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。
提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文 参考訳(メタデータ) (2023-12-22T14:40:55Z) - Probabilistic Self-supervised Learning via Scoring Rules Minimization [19.347097627898876]
本稿では,Scoring Rule Minimization (ProSMIN) を用いた確率論的自己教師型学習を提案する。
提案手法は,大規模データセットを用いた多種多様な実験において,自己教師付きベースラインを超える精度とキャリブレーションを実現する。
論文 参考訳(メタデータ) (2023-09-05T08:48:25Z) - Toward Fair Facial Expression Recognition with Improved Distribution
Alignment [19.442685015494316]
本稿では,表情認識(FER)モデルにおけるバイアスを軽減する新しい手法を提案する。
本手法は、FERモデルによる埋め込みにおいて、性別、年齢、人種などの機密属性情報を低減することを目的としている。
ferモデルにおいて、魅力の概念を重要な感度属性として分析し、FERモデルがより魅力的な顔に対するバイアスを実際に示できることを実証する。
論文 参考訳(メタデータ) (2023-06-11T14:59:20Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Analyzing the Effect of Sampling in GNNs on Individual Fairness [79.28449844690566]
グラフニューラルネットワーク(GNN)ベースの手法は、レコメンダシステムの分野を飽和させた。
我々は,GNNの学習を支援するために,グラフ上で個別の公平性を促進させる既存手法を拡張した。
本研究では,局所ニュアンスが表現学習における公平化促進の過程を導くことによって,ミニバッチトレーニングが個人の公正化を促進することを示す。
論文 参考訳(メタデータ) (2022-09-08T16:20:25Z) - Towards Unbiased Label Distribution Learning for Facial Pose Estimation
Using Anisotropic Spherical Gaussian [8.597165738132617]
Anisotropic Spherical Gaussian (ASG)-based LDL approach for face pose Estimationを提案する。
特に、我々のアプローチでは、不偏期待を常に生成する単位球面上の球面ガウス分布を採用する。
提案手法は, AFLW2000 と BIWI のデータセットに新たな最先端記録を設定する。
論文 参考訳(メタデータ) (2022-08-19T02:12:36Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation [65.5880700862751]
本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-03T15:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。