Fugu-MT 論文翻訳(概要): A Dual-Source Attention Transformer for Multi-Person Pose Tracking

論文の概要: A Dual-Source Attention Transformer for Multi-Person Pose Tracking

arxiv url: http://arxiv.org/abs/2306.05807v1
Date: Fri, 9 Jun 2023 10:44:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-12 13:48:46.112132
Title: A Dual-Source Attention Transformer for Multi-Person Pose Tracking
Title（参考訳）: 多人数ポーズ追跡のためのデュアルソースアテンショントランス
Authors: Andreas Doering and Juergen Gall
Abstract要約: マルチパーソンポーズトラッキングは多くのアプリケーションにとって重要な要素である。フレーム間のポーズの関連は、まだオープンな研究課題である。 3つの中核的な側面を組み込んだデュアルソース・アテンション・トランスを提案する。
参考スコア（独自算出の注目度）: 18.460035325229683
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-person pose tracking is an important element for many applications and requires to estimate the human poses of all persons in a video and to track them over time. The association of poses across frames remains an open research problem, in particular for online tracking methods, due to motion blur, crowded scenes and occlusions. To tackle the association challenge, we propose a Dual-Source Attention Transformer that incorporates three core aspects: i) In order to re-identify persons that have been occluded, we propose a pose-conditioned re-identification network that provides an initial embedding and allows to match persons even if the number of visible joints differs between the frames. ii) We incorporate edge embeddings based on temporal pose similarity and the impact of appearance and pose similarity is automatically adapted. iii) We propose an attention based matching layer for pose-to-track association and duplicate removal. We evaluate our approach on Market1501, PoseTrack 2018 and PoseTrack21.
Abstract（参考訳）: マルチパーソンのポーズトラッキングは多くのアプリケーションにとって重要な要素であり、ビデオ内のすべての人のポーズを推定し、時間とともに追跡する必要がある。フレーム間のポーズの関連性は、特に動きのぼやけや混みのあるシーン、オクルージョンなどによるオンライントラッキング手法において、オープンな研究課題である。協会の課題に取り組むために,3つの中核的な側面を取り入れたデュアルソース・アテンション・トランスを提案する。一隠蔽された人物を再識別するために、初期埋め込みを提供するポーズ条件付き再識別ネットワークを提案し、フレーム間で可視関節の数が異なる場合でも、人物と一致させることができる。二時相相似性に基づくエッジ組込みを取り入れ、外観及びポーズ相似性の影響を自動的に適応させる。 iii) ポーズとトラックの関連付けと重複除去のための注意に基づくマッチング層を提案する。 market1501, posetrack 2018, posetrack21のアプローチを評価した。

関連論文リスト

PoseAnything: Universal Pose-guided Video Generation with Part-aware Temporal Coherence [67.78835640962167]
ポーズ誘導映像生成(Pose-Guided video generation)とは、ポーズの連続を通して生成された映像中の被写体の動きを制御すること。我々は、人間と非人間の両方を扱える初のユニバーサルポーズ誘導ビデオ生成フレームワークであるPoseAnythingを提案する。提案するXPoseは,5万対のポーズビデオと,アノテーションとフィルタリングのための自動パイプラインを含む高品質な公開データセットである。
論文参考訳（メタデータ） (2025-12-15T16:03:26Z)
No Identity, no problem: Motion through detection for people tracking [48.708733485434394]
本稿では,検出のみの監視を行いながら,動きの手がかりを利用する手法を提案する。提案アルゴリズムは,2つの画像間の2次元運動推定とともに,2つの異なるタイミングで熱マップを検出する。提案手法は,MOT17およびWILDTRACKデータセット上でのマルチターゲット・シングルビュー・マルチターゲット・トラッキングに対して,最先端の結果を提供する。
論文参考訳（メタデータ） (2024-11-25T15:13:17Z)
VINECS: Video-based Neural Character Skinning [82.39776643541383]
ポーズ依存のスキン重みを持つ完全リップ文字を作成するための完全自動アプローチを提案する。提案手法は高密度4Dスキャンに頼らず,最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2023-07-03T08:35:53Z)
OTPose: Occlusion-Aware Transformer for Pose Estimation in Sparsely-Labeled Videos [21.893572076171527]
本稿では, コンバータを用いたフレーム間の時間依存性を符号化する手法を提案する。我々は、PoseTrack 2017とPoseTrack 2018データセットの最先端のポーズ推定結果を達成する。
論文参考訳（メタデータ） (2022-07-20T08:06:06Z)
Neural Rendering of Humans in Novel View and Pose from Monocular Video [68.37767099240236]
本稿では,新しい視点下で写真リアルな人間を生成し,モノクロ映像を入力として提示する新しい手法を提案する。提案手法は,モノクラー映像を入力として,見知らぬポーズや新しい視点下での既存手法よりも優れていた。
論文参考訳（メタデータ） (2022-04-04T03:09:20Z)
Pose-driven Attention-guided Image Generation for Person Re-Identification [39.605062525247135]
複数人のポーズを生成するために,エンドツーエンドのポーズ駆動型ジェネレーション対人ネットワークを提案する。ポーズ転送中の人のセマンティック情報を保存するためにセマンティック一貫性損失が提案される。提案手法を人物再識別フレームワークに組み込むことにより,リアルなポーズ転送画像と最先端の再識別結果を実現できることを示した。
論文参考訳（メタデータ） (2021-04-28T14:02:24Z)
FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。 MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文参考訳（メタデータ） (2021-04-04T21:45:44Z)
Deep Dual Consecutive Network for Human Pose Estimation [44.41818683253614]
キーポイント検出を容易にするために,ビデオフレーム間の時間的キューを豊富に活用した,新しいマルチフレーム人間ポーズ推定フレームワークを提案する。本手法は、PoseTrack 2017およびPoseTrack 2018の大規模ベンチマークデータセットにおけるマルチフレームパーソンポースチャレンジチャレンジで1位にランクインします。
論文参考訳（メタデータ） (2021-03-12T13:11:27Z)
PoNA: Pose-guided Non-local Attention for Human Pose Transfer [105.14398322129024]
本稿では, 簡易ブロックを用いたGAN(Generative Adversarial Network)を用いた新しいポーズ転送手法を提案する。我々のモデルはより鮮明でよりリアルな画像を生成するが、パラメータは少なく、速度も速い。
論文参考訳（メタデータ） (2020-12-13T12:38:29Z)
PoseTrackReID: Dataset Description [97.7241689753353]
詩情報は、背景や閉塞音から有用な特徴情報を遠ざけるのに役立つ。 PoseTrackReIDでは、人物のリIDと複数人のポーズトラッキングのギャップを埋めたいと考えています。このデータセットは、マルチフレームの人物のre-IDに関する現在の最先端メソッドに対する優れたベンチマークを提供する。
論文参考訳（メタデータ） (2020-11-12T07:44:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。