論文の概要: Improving Multi-Person Pose Tracking with A Confidence Network
- arxiv url: http://arxiv.org/abs/2310.18920v1
- Date: Sun, 29 Oct 2023 06:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 15:27:04.508893
- Title: Improving Multi-Person Pose Tracking with A Confidence Network
- Title(参考訳): 信頼ネットワークによるマルチパーソンポーズ追跡の改善
- Authors: Zehua Fu, Wenhang Zuo, Zhenghui Hu, Qingjie Liu, Yunhong Wang
- Abstract要約: 我々は、人間の検出とポーズ推定を改善するために、新しいキーポイント信頼ネットワークと追跡パイプラインを開発する。
具体的には、キーポイント信頼ネットワークは、各キーポイントが閉鎖されているかどうかを決定するように設計されている。
追従パイプラインでは,Bbox-revisionモジュールが欠落検出を低減し,ID-retrieveモジュールが損失軌跡を補正する。
- 参考スコア(独自算出の注目度): 37.84514614455588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human pose estimation and tracking are fundamental tasks for understanding
human behaviors in videos. Existing top-down framework-based methods usually
perform three-stage tasks: human detection, pose estimation and tracking.
Although promising results have been achieved, these methods rely heavily on
high-performance detectors and may fail to track persons who are occluded or
miss-detected. To overcome these problems, in this paper, we develop a novel
keypoint confidence network and a tracking pipeline to improve human detection
and pose estimation in top-down approaches. Specifically, the keypoint
confidence network is designed to determine whether each keypoint is occluded,
and it is incorporated into the pose estimation module. In the tracking
pipeline, we propose the Bbox-revision module to reduce missing detection and
the ID-retrieve module to correct lost trajectories, improving the performance
of the detection stage. Experimental results show that our approach is
universal in human detection and pose estimation, achieving state-of-the-art
performance on both PoseTrack 2017 and 2018 datasets.
- Abstract(参考訳): 人間のポーズ推定と追跡は、ビデオにおける人間の行動を理解するための基本的なタスクである。
既存のトップダウンフレームワークベースのメソッドは通常、人間検出、ポーズ推定、追跡という3段階のタスクを実行する。
有望な結果が得られたが、これらの方法は高性能検出器に大きく依存しており、閉塞されたり誤検出された人を追跡できない可能性がある。
そこで本稿では,このような課題を克服するために,新しいキーポイント信頼度ネットワークと追跡パイプラインを開発し,トップダウンアプローチにおける人間検出とポーズ推定を改善する。
特に、キーポイント信頼ネットワークは、各キーポイントが閉鎖されているかどうかを判断するように設計され、ポーズ推定モジュールに組み込まれる。
追従パイプラインにおいて,Bbox-revisionモジュールは,紛失検出を低減し,ID-retrieveモジュールは損失軌跡を補正し,検出ステージの性能を向上させる。
実験結果から,PoseTrack 2017と2018の両データセットの最先端性能を達成し,人間の検出とポーズ推定におけるアプローチが普遍的であることが示された。
関連論文リスト
- RTracker: Recoverable Tracking via PN Tree Structured Memory [71.05904715104411]
本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文 参考訳(メタデータ) (2024-03-28T08:54:40Z) - Human Pose-based Estimation, Tracking and Action Recognition with Deep
Learning: A Survey [15.920237822185301]
本稿では, 深層学習, ポーズ推定, ポーズ追跡, 行動認識を応用したポーズベースアプリケーションについて検討する。
姿勢推定は、画像や画像のシーケンスから人間の関節の位置を決定することである。
ポーズトラッキングは、時間とともに一貫性のある人間のポーズトラジェクトリを生成することを目的とした、新たな研究方向である。
アクション認識は、ポーズ推定や追跡データを使用してアクションタイプの識別をターゲットとする。
論文 参考訳(メタデータ) (2023-10-19T17:59:04Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Dual networks based 3D Multi-Person Pose Estimation from Monocular Video [42.01876518017639]
複数人の3Dポーズ推定はシングルポーズ推定よりも難しい。
既存のトップダウンとボトムアップのアプローチでは、推定が検出エラーに悩まされる。
我々は,トップダウンアプローチとボトムアップアプローチを統合して,その強みを活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T08:53:38Z) - PONet: Robust 3D Human Pose Estimation via Learning Orientations Only [116.1502793612437]
本稿では,学習向きのみを用いて3次元ポーズを頑健に推定できる新しいPose Orientation Net(PONet)を提案する。
PONetは、局所的な画像証拠を利用して、これらの手足の3D方向を推定し、3Dポーズを復元する。
我々は,Human3.6M,MPII,MPI-INF-3DHP,3DPWを含む複数のデータセットについて評価を行った。
論文 参考訳(メタデータ) (2021-12-21T12:48:48Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Monocular 3D Multi-Person Pose Estimation by Integrating Top-Down and
Bottom-Up Networks [33.974241749058585]
マルチパーソンポーズ推定は、人間の検出が間違っている可能性があり、人間の結合群は信頼できない。
既存のトップダウン手法は人間の検出に依存しているため、これらの問題に悩まされる。
我々は,その強みを生かすために,トップダウンアプローチとボトムアップアプローチの統合を提案する。
論文 参考訳(メタデータ) (2021-04-05T07:05:21Z) - Detecting Invisible People [58.49425715635312]
我々は,追跡ベンチマークを再利用し,目立たない物体を検出するための新しい指標を提案する。
私たちは、現在の検出および追跡システムがこのタスクで劇的に悪化することを実証します。
第2に,最先端の単眼深度推定ネットワークによる観測結果を用いて,3次元で明示的に推論する動的モデルを構築した。
論文 参考訳(メタデータ) (2020-12-15T16:54:45Z) - Uncertainty-Aware Voxel based 3D Object Detection and Tracking with
von-Mises Loss [13.346392746224117]
不確実性は、認識システムのエラーに対処し、堅牢性を改善するのに役立ちます。
本稿では,SECOND検出器に不確実性レグレッションを追加することにより,目標追尾性能を向上させる手法を提案する。
論文 参考訳(メタデータ) (2020-11-04T21:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。