論文の概要: RankPose: Learning Generalised Feature with Rank Supervision for Head
Pose Estimation
- arxiv url: http://arxiv.org/abs/2005.10984v1
- Date: Fri, 22 May 2020 03:27:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:14:56.887956
- Title: RankPose: Learning Generalised Feature with Rank Supervision for Head
Pose Estimation
- Title(参考訳): RankPose: ヘッドポーズ推定のためのランクスーパービジョンを備えた一般機能学習
- Authors: Donggen Dai, Wangkit Wong, Zhuojun Chen
- Abstract要約: 我々は頭部ポーズ表現学習を再構成し、それを有界空間に制約する。
MSE回帰損失と組み合わせたランキング損失を提案する。
AFLW2000 と BIWI における従来の SOTA MAE よりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 2.4493299476776778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the challenging problem of RGB image-based head pose estimation.
We first reformulate head pose representation learning to constrain it to a
bounded space. Head pose represented as vector projection or vector angles
shows helpful to improving performance. Further, a ranking loss combined with
MSE regression loss is proposed. The ranking loss supervises a neural network
with paired samples of the same person and penalises incorrect ordering of pose
prediction. Analysis on this new loss function suggests it contributes to a
better local feature extractor, where features are generalised to Abstract
Landmarks which are pose-related features instead of pose-irrelevant
information such as identity, age, and lighting. Extensive experiments show
that our method significantly outperforms the current state-of-the-art schemes
on public datasets: AFLW2000 and BIWI. Our model achieves significant
improvements over previous SOTA MAE on AFLW2000 and BIWI from 4.50 to 3.66 and
from 4.0 to 3.71 respectively. Source code will be made available at:
https://github.com/seathiefwang/RankHeadPose.
- Abstract(参考訳): RGB画像に基づく頭部ポーズ推定の課題に対処する。
まず,頭姿勢表現学習を再構成し,境界空間に制約する。
ベクトル投影やベクトル角として表される頭部ポーズは、性能向上に役立つ。
さらに,MSE回帰損失と組み合わせたランキング損失を提案する。
ランキング損失は、同一人物のペアサンプルでニューラルネットワークを監督し、ポーズ予測の誤った順序付けを行う。
この新たな損失関数の解析により,特徴抽出器がより優れた局所特徴抽出器に寄与することが示唆され,特徴は識別,年齢,照明などのポーズ関連情報ではなく,ポーズ関連の特徴である抽象ランドマークに一般化される。
AFLW2000 や BIWI といった公開データセット上での現在の最先端のスキームよりも優れていた。
AFLW2000の以前のSOTA MAEとBIWIの4.50から3.66および4.0から3.71への大幅な改善を実現した。
ソースコードはhttps://github.com/seathiefwang/rankheadposeで入手できる。
関連論文リスト
- DOR3D-Net: Dense Ordinal Regression Network for 3D Hand Pose Estimation [6.327974053228352]
我々は高次回帰問題として3次元手ポーズ推定を再定式化する。
我々はDOR3D-Net(Dense Ordinal Regression 3D Pose Network)を提案する。
我々の設計はSOTA法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-20T08:47:51Z) - A Study of Forward-Forward Algorithm for Self-Supervised Learning [65.268245109828]
本研究では,自己指導型表現学習におけるフォワードとバックプロパゲーションのパフォーマンスについて検討する。
我々の主な発見は、フォワードフォワードアルゴリズムが(自己教師付き)トレーニング中にバックプロパゲーションに相容れないように機能するのに対し、転送性能は研究されたすべての設定において著しく遅れていることである。
論文 参考訳(メタデータ) (2023-09-21T10:14:53Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Generalizing Neural Human Fitting to Unseen Poses With Articulated SE(3)
Equivariance [48.39751410262664]
ArtEqは、点雲からのSMPLモデル推定のための部分ベースSE(3)等価ニューラルネットワークである。
実験の結果,ArtEqはトレーニング中に見えない動作を一般化し,身体再建精度の点で最先端の手法を44%上回った。
論文 参考訳(メタデータ) (2023-04-20T17:58:26Z) - SSP-Pose: Symmetry-Aware Shape Prior Deformation for Direct
Category-Level Object Pose Estimation [77.88624073105768]
カテゴリーレベルのポーズ推定は、クラス内形状の変化によって難しい問題である。
カテゴリレベルのポーズ推定のためのエンドツーエンドのトレーニング可能なネットワークSSP-Poseを提案する。
SSP-Poseは、リアルタイムの推論速度が約25Hzの競合に比べて性能が優れている。
論文 参考訳(メタデータ) (2022-08-13T14:37:31Z) - Adaptive Self-supervision Algorithms for Physics-informed Neural
Networks [59.822151945132525]
物理情報ニューラルネットワーク(PINN)は、損失関数のソフト制約として問題領域からの物理的知識を取り入れている。
これらのモデルの訓練性に及ぼす座標点の位置の影響について検討した。
モデルがより高い誤りを犯している領域に対して、より多くのコロケーションポイントを段階的に割り当てる適応的コロケーション方式を提案する。
論文 参考訳(メタデータ) (2022-07-08T18:17:06Z) - A Simple Method to Boost Human Pose Estimation Accuracy by Correcting
the Joint Regressor for the Human3.6m Dataset [21.096409769550387]
SMPL-to-joint linear layer (joint regressor) は不正確である。
より高精度な継手回帰器を実現するために,擬似地下構造SMPLポーズを作成する手法を提案する。
我々の回帰器は、再トレーニングを必要とせずに、テストセットのポーズ推定の改善につながることを示す。
論文 参考訳(メタデータ) (2022-04-29T20:42:48Z) - Exploring intermediate representation for monocular vehicle pose
estimation [38.85309013717312]
1枚のRGB画像からSO(3)の車両ポーズを復元する学習ベースの新しいフレームワークを提案する。
局所的な外観から観測角度へマッピングする以前の作品とは対照的に、我々は意味のある中間幾何学的表現(IGR)を抽出して進歩的なアプローチを探求する。
このアプローチは、知覚強度をIGRに変換するディープモデルを特徴とし、カメラ座標系における物体の向きを符号化する3次元表現にマッピングする。
論文 参考訳(メタデータ) (2020-11-17T06:30:51Z) - A Vector-based Representation to Enhance Head Pose Estimation [4.329951775163721]
本稿では,回転行列における3つのベクトルを頭部ポーズ推定の表現として用いることを提案する。
我々はそのような表現の特徴に基づく新しいニューラルネットワークを開発する。
論文 参考訳(メタデータ) (2020-10-14T15:57:29Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。