論文の概要: AID: Pushing the Performance Boundary of Human Pose Estimation with
Information Dropping Augmentation
- arxiv url: http://arxiv.org/abs/2008.07139v2
- Date: Tue, 17 Nov 2020 08:07:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:02:33.745461
- Title: AID: Pushing the Performance Boundary of Human Pose Estimation with
Information Dropping Augmentation
- Title(参考訳): AID:情報ドロップ増強による人文推定の性能境界を押し上げる
- Authors: Junjie Huang, Zheng Zhu, Guan Huang, Dalong Du
- Abstract要約: 本稿では,このジレンマを検証・対処するために,情報ドロップによる拡張を提案する。
カスタマイズされたトレーニングスケジュールは、情報提供の観点から、トレーニングプロセスにおける損失パターンとパフォーマンスパターンを分析して設計される。
AIDは、トップダウンパラダイムでは0.6 AP、ボトムアップパラダイムでは1.5 APまで、さまざまな構成のパフォーマンスを一貫して向上させる。
- 参考スコア(独自算出の注目度): 23.366620137910967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Both appearance cue and constraint cue are vital for human pose estimation.
However, there is a tendency in most existing works to overfitting the former
and overlook the latter. In this paper, we propose Augmentation by Information
Dropping (AID) to verify and tackle this dilemma. Alone with AID as a
prerequisite for effectively exploiting its potential, we propose customized
training schedules, which are designed by analyzing the pattern of loss and
performance in training process from the perspective of information supplying.
In experiments, as a model-agnostic approach, AID promotes various
state-of-the-art methods in both bottom-up and top-down paradigms with
different input sizes, frameworks, backbones, training and testing sets. On
popular COCO human pose estimation test set, AID consistently boosts the
performance of different configurations by around 0.6 AP in top-down paradigm
and up to 1.5 AP in bottom-up paradigm. On more challenging CrowdPose dataset,
the improvement is more than 1.5 AP. As AID successfully pushes the performance
boundary of human pose estimation problem by considerable margin and sets a new
state-of-the-art, we hope AID to be a regular configuration for training human
pose estimators. The source code will be publicly available for further
research.
- Abstract(参考訳): 人間のポーズ推定には、外観手がかりと制約手がかりの両方が不可欠である。
しかし、現存する作品の多くは前者を過度に見落とし、後者を見落としている傾向にある。
本稿では,このジレンマを検証・対処するために,AID(Augmentation by Information Dropping)を提案する。
AIDを有効活用するための前提条件として,情報提供の観点から学習過程における損失パターンと性能パターンを解析し,カスタマイズしたトレーニングスケジュールを提案する。
実験では、モデルに依存しないアプローチとして、AIDは、さまざまな入力サイズ、フレームワーク、バックボーン、トレーニング、テストセットを持つボトムアップおよびトップダウンのパラダイムにおいて、様々な最先端のメソッドを促進する。
一般的なCOCOヒューマンポーズ推定テストセットでは、AIDはトップダウンパラダイムでは0.6 AP、ボトムアップパラダイムでは1.5APまで、さまざまな構成のパフォーマンスを一貫して向上させる。
より難しいCrowdPoseデータセットでは、改善は1.5 AP以上である。
AIDは、人間のポーズ推定問題の性能境界をかなりの差で押し上げ、新しい最先端を設定できるので、AIDが人間のポーズ推定者のトレーニングのための定期的な構成になることを期待する。
ソースコードは、さらなる研究のために公開されます。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文 参考訳(メタデータ) (2024-06-10T06:26:03Z) - Semi-supervised 2D Human Pose Estimation via Adaptive Keypoint Masking [2.297586471170049]
本稿では,サンプル中の情報を完全にマイニングし,より優れた推定性能が得られる適応型キーポイントマスキング法を提案する。
提案手法の有効性をCOCOとMPIIで検証し,最先端の半教師によるポーズ推定をそれぞれ5.2%と0.3%で上回った。
論文 参考訳(メタデータ) (2024-04-23T08:41:50Z) - Source-Guided Similarity Preservation for Online Person
Re-Identification [3.655597435084387]
Online Unsupervised Domain Adaptation (OUDA)は、よくアノテーションされたソースドメインデータセットでトレーニングされたモデルを、データストリームとして観測されたターゲットドメインに継続的に適応させるタスクである。
OUDAでは、人物Re-IDモデルは、破滅的な忘れとドメインシフトという、2つの大きな課題に直面しています。
本稿では、これら2つの問題を緩和する新しいソース誘導類似性保存(S2P)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-23T09:07:20Z) - Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。
textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文 参考訳(メタデータ) (2023-07-29T03:49:28Z) - PoseExaminer: Automated Testing of Out-of-Distribution Robustness in
Human Pose and Shape Estimation [15.432266117706018]
我々は人間のポーズのイメージの多様体を探索するために、きめ細かい方法で制御できるシミュレータを開発した。
本稿では,HPSアルゴリズムを自動診断するPoseExaminerという学習ベースのテスト手法を提案する。
我々のPoseExaminerは、現実のシナリオに関係のある現在の最先端モデルにおいて、様々な制限を発見できることを示す。
論文 参考訳(メタデータ) (2023-03-13T17:58:54Z) - Semi-Supervised 2D Human Pose Estimation Driven by Position
Inconsistency Pseudo Label Correction Module [74.80776648785897]
i) 大規模モデルと軽量モデルの間で対話的なトレーニングを行う場合, 大規模モデルのガイドに擬似的な軽量モデルラベルを用いる。
位置整合性擬似ラベル補正モジュール(SSPCM)により駆動される半教師付き2次元ポーズ推定フレームワークを提案する。
学生モデルの性能向上のために,擬似キーポイント認識に基づく半教師付きカットオクルードを用いて,より硬く効果的なサンプルを生成する。
論文 参考訳(メタデータ) (2023-03-08T02:57:05Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。