論文の概要: Towards Unbiased Label Distribution Learning for Facial Pose Estimation
Using Anisotropic Spherical Gaussian
- arxiv url: http://arxiv.org/abs/2208.09122v1
- Date: Fri, 19 Aug 2022 02:12:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-22 17:06:49.416670
- Title: Towards Unbiased Label Distribution Learning for Facial Pose Estimation
Using Anisotropic Spherical Gaussian
- Title(参考訳): 異方性球面ガウスを用いた顔ポーズ推定のための不偏ラベル分布学習
- Authors: Zhiwen Cao, Dongfang Liu, Qifan Wang, Yingjie Chen
- Abstract要約: Anisotropic Spherical Gaussian (ASG)-based LDL approach for face pose Estimationを提案する。
特に、我々のアプローチでは、不偏期待を常に生成する単位球面上の球面ガウス分布を採用する。
提案手法は, AFLW2000 と BIWI のデータセットに新たな最先端記録を設定する。
- 参考スコア(独自算出の注目度): 8.597165738132617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial pose estimation refers to the task of predicting face orientation from
a single RGB image. It is an important research topic with a wide range of
applications in computer vision. Label distribution learning (LDL) based
methods have been recently proposed for facial pose estimation, which achieve
promising results. However, there are two major issues in existing LDL methods.
First, the expectations of label distributions are biased, leading to a biased
pose estimation. Second, fixed distribution parameters are applied for all
learning samples, severely limiting the model capability. In this paper, we
propose an Anisotropic Spherical Gaussian (ASG)-based LDL approach for facial
pose estimation. In particular, our approach adopts the spherical Gaussian
distribution on a unit sphere which constantly generates unbiased expectation.
Meanwhile, we introduce a new loss function that allows the network to learn
the distribution parameter for each learning sample flexibly. Extensive
experimental results show that our method sets new state-of-the-art records on
AFLW2000 and BIWI datasets.
- Abstract(参考訳): 顔のポーズ推定は、単一のRGB画像から顔の向きを予測するタスクを指す。
コンピュータビジョンにおける幅広い応用分野において重要な研究テーマである。
ラベル分布学習(LDL)に基づく顔のポーズ推定法が最近提案され,有望な結果が得られた。
しかし、既存のLCL法には2つの大きな問題がある。
まず、ラベル分布の期待値が偏り、偏りのあるポーズ推定となる。
第二に、固定分布パラメータが全ての学習サンプルに適用され、モデル能力が著しく制限される。
本稿では,Anisotropic Spherical Gaussian (ASG) を用いた顔ポーズ推定のためのLCL手法を提案する。
特に, 単位球面上の球面ガウス分布は, 常に偏りのない期待値を生成する。
一方,ネットワークが各学習サンプルの分布パラメータを柔軟に学習できる新たな損失関数を導入する。
実験結果から,AFLW2000およびBIWIデータセットに新たな最先端記録が設定された。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Bridging the Projection Gap: Overcoming Projection Bias Through Parameterized Distance Learning [9.26015904497319]
Generalized Zero-shot Learning (GZSL) は、見知らぬクラスと見えないクラスの両方からのサンプルを、学習用のクラスサンプルのみを使用して認識することを目的としている。
GZSL法は、投射関数が観測クラスから学習されるため、推論中に観測クラスに偏りが生じる傾向にある。
我々はこの予測バイアスに,ロバスト推論のためのパラメータ化されたマハラノビス距離測定値の学習を提案して対処する。
論文 参考訳(メタデータ) (2023-09-04T06:41:29Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Sharp-SSL: Selective high-dimensional axis-aligned random projections
for semi-supervised learning [16.673022545571566]
本稿では,高次元半教師付き学習問題に対する新しい手法を提案する。
これは、データの多くの軸方向のランダムな投影に適用される低次元プロシージャの結果の慎重な集約に基づいている。
論文 参考訳(メタデータ) (2023-04-18T17:49:02Z) - Lightweight Facial Attractiveness Prediction Using Dual Label Distribution [16.60169799392108]
顔の魅力予測(FAP)は、人間の美的知覚に基づいて顔の魅力を自動的に評価することを目的としている。
両ラベル分布と軽量設計を統合した新しいエンドツーエンドFAP手法を提案する。
提案手法は有望な結果を達成し,性能と効率のバランスをとることに成功している。
論文 参考訳(メタデータ) (2022-12-04T04:19:36Z) - GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP,
and Beyond [101.5329678997916]
対話型意思決定の一般的な枠組みの下で, サンプル高能率強化学習(RL)について検討した。
本稿では,探索とエクスプロイトの基本的なトレードオフを特徴付ける,新しい複雑性尺度である一般化エルダー係数(GEC)を提案する。
低 GEC の RL 問題は非常にリッチなクラスであり、これは低ベルマン楕円体次元問題、双線型クラス、低証人ランク問題、PO-双線型クラス、一般化正規PSR を仮定する。
論文 参考訳(メタデータ) (2022-11-03T16:42:40Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - Balancing Biases and Preserving Privacy on Balanced Faces in the Wild [50.915684171879036]
現在の顔認識(FR)モデルには、人口統計バイアスが存在する。
さまざまな民族と性別のサブグループにまたがる偏見を測定するために、我々のバランス・フェイススをWildデータセットに導入します。
真偽と偽のサンプルペアを区別するために1点のスコアしきい値に依存すると、最適以下の結果が得られます。
本稿では,最先端ニューラルネットワークから抽出した顔特徴を用いたドメイン適応学習手法を提案する。
論文 参考訳(メタデータ) (2021-03-16T15:05:49Z) - Achieving Efficiency in Black Box Simulation of Distribution Tails with
Self-structuring Importance Samplers [1.6114012813668934]
本稿では,線形プログラムや整数線形プログラム,ピースワイド線形・二次目的,ディープニューラルネットワークで指定された特徴マップなど,多種多様なツールでモデル化されたパフォーマンス指標の分布を推定する,新しいImportance Smpling(IS)方式を提案する。
論文 参考訳(メタデータ) (2021-02-14T03:37:22Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Distributional Reinforcement Learning via Moment Matching [54.16108052278444]
ニューラルネットワークを用いて各戻り分布から統計量の有限集合を学習する手法を定式化する。
我々の手法は、戻り分布とベルマン目標の間のモーメントの全ての順序を暗黙的に一致させるものとして解釈できる。
Atariゲームスイートの実験により,本手法は標準分布RLベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-07-24T05:18:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。