論文の概要: A Gated Attention Transformer for Multi-Person Pose Tracking
- arxiv url: http://arxiv.org/abs/2306.05807v2
- Date: Mon, 21 Aug 2023 17:45:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 23:36:20.526137
- Title: A Gated Attention Transformer for Multi-Person Pose Tracking
- Title(参考訳): マルチパーソンポーズトラッキングのためのゲーテッドアテンション変換器
- Authors: Andreas Doering and Juergen Gall
- Abstract要約: 本稿では,協会の課題に対処するゲーテッド・アテンション・トランスフォーマーを提案する。
我々のモデルの中核的な側面は、外観埋め込みの影響を自動的に適応するゲーティング機構である。
隠蔽された人物を再識別するために,ポーズ条件付き再識別ネットワークを組み込んだ。
- 参考スコア(独自算出の注目度): 18.84879578518942
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-person pose tracking is an important element for many applications and
requires to estimate the human poses of all persons in a video and to track
them over time. The association of poses across frames remains an open research
problem, in particular for online tracking methods, due to motion blur, crowded
scenes and occlusions. To tackle the association challenge, we propose a Gated
Attention Transformer. The core aspect of our model is the gating mechanism
that automatically adapts the impact of appearance embeddings and embeddings
based on temporal pose similarity in the attention layers. In order to
re-identify persons that have been occluded, we incorporate a pose-conditioned
re-identification network that provides initial embeddings and allows to match
persons even if the number of visible joints differ between frames. We further
propose a matching layer based on gated attention for pose-to-track association
and duplicate removal. We evaluate our approach on PoseTrack 2018 and
PoseTrack21.
- Abstract(参考訳): マルチパーソンのポーズトラッキングは多くのアプリケーションにとって重要な要素であり、ビデオ内のすべての人のポーズを推定し、時間とともに追跡する必要がある。
フレーム間のポーズの関連性は、特に動きのぼやけや混みのあるシーン、オクルージョンなどによるオンライントラッキング手法において、オープンな研究課題である。
学会の課題に対処するため,Gated Attention Transformerを提案する。
我々のモデルの中核的な側面は、注意層における時間的ポーズ類似性に基づく外観埋め込みと埋め込みの影響を自動的に適応するゲーティング機構である。
被検者を再特定するために, フレーム間で目に見える関節の数が異なる場合でも, 初期埋め込みを提供し, 人物とのマッチングを可能にするポーズ条件付き再識別ネットワークを組み込んだ。
さらに,ポーズ・トラック間関係と重複除去のためのゲート付き注意に基づくマッチング層を提案する。
PoseTrack 2018とPoseTrack21のアプローチを評価します。
関連論文リスト
- No Identity, no problem: Motion through detection for people tracking [48.708733485434394]
本稿では,検出のみの監視を行いながら,動きの手がかりを利用する手法を提案する。
提案アルゴリズムは,2つの画像間の2次元運動推定とともに,2つの異なるタイミングで熱マップを検出する。
提案手法は,MOT17およびWILDTRACKデータセット上でのマルチターゲット・シングルビュー・マルチターゲット・トラッキングに対して,最先端の結果を提供する。
論文 参考訳(メタデータ) (2024-11-25T15:13:17Z) - VINECS: Video-based Neural Character Skinning [82.39776643541383]
ポーズ依存のスキン重みを持つ完全リップ文字を作成するための完全自動アプローチを提案する。
提案手法は高密度4Dスキャンに頼らず,最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-03T08:35:53Z) - OTPose: Occlusion-Aware Transformer for Pose Estimation in
Sparsely-Labeled Videos [21.893572076171527]
本稿では, コンバータを用いたフレーム間の時間依存性を符号化する手法を提案する。
我々は、PoseTrack 2017とPoseTrack 2018データセットの最先端のポーズ推定結果を達成する。
論文 参考訳(メタデータ) (2022-07-20T08:06:06Z) - Neural Rendering of Humans in Novel View and Pose from Monocular Video [68.37767099240236]
本稿では,新しい視点下で写真リアルな人間を生成し,モノクロ映像を入力として提示する新しい手法を提案する。
提案手法は,モノクラー映像を入力として,見知らぬポーズや新しい視点下での既存手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-04T03:09:20Z) - Pose-driven Attention-guided Image Generation for Person
Re-Identification [39.605062525247135]
複数人のポーズを生成するために,エンドツーエンドのポーズ駆動型ジェネレーション対人ネットワークを提案する。
ポーズ転送中の人のセマンティック情報を保存するためにセマンティック一貫性損失が提案される。
提案手法を人物再識別フレームワークに組み込むことにより,リアルなポーズ転送画像と最先端の再識別結果を実現できることを示した。
論文 参考訳(メタデータ) (2021-04-28T14:02:24Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - Deep Dual Consecutive Network for Human Pose Estimation [44.41818683253614]
キーポイント検出を容易にするために,ビデオフレーム間の時間的キューを豊富に活用した,新しいマルチフレーム人間ポーズ推定フレームワークを提案する。
本手法は、PoseTrack 2017およびPoseTrack 2018の大規模ベンチマークデータセットにおけるマルチフレームパーソンポースチャレンジチャレンジで1位にランクインします。
論文 参考訳(メタデータ) (2021-03-12T13:11:27Z) - PoNA: Pose-guided Non-local Attention for Human Pose Transfer [105.14398322129024]
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。
我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
論文 参考訳(メタデータ) (2020-12-13T12:38:29Z) - PoseTrackReID: Dataset Description [97.7241689753353]
詩情報は、背景や閉塞音から有用な特徴情報を遠ざけるのに役立つ。
PoseTrackReIDでは、人物のリIDと複数人のポーズトラッキングのギャップを埋めたいと考えています。
このデータセットは、マルチフレームの人物のre-IDに関する現在の最先端メソッドに対する優れたベンチマークを提供する。
論文 参考訳(メタデータ) (2020-11-12T07:44:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。