論文の概要: The Center of Attention: Center-Keypoint Grouping via Attention for
Multi-Person Pose Estimation
- arxiv url: http://arxiv.org/abs/2110.05132v1
- Date: Mon, 11 Oct 2021 10:22:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 18:32:42.859140
- Title: The Center of Attention: Center-Keypoint Grouping via Attention for
Multi-Person Pose Estimation
- Title(参考訳): 注意センター:マルチパーソンポーズ推定のための注意によるセンターキーポイントグループ化
- Authors: Guillem Bras\'o, Nikita Kister, Laura Leal-Taix\'e
- Abstract要約: CenterGroupは、画像内のアイデンティティに依存しないキーポイントと人中心予測のセットから人間のポーズを推定する注意ベースのフレームワークである。
提案手法は、競合するボトムアップ法よりも2.5倍高速な推論時間を有する最先端性能を得る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce CenterGroup, an attention-based framework to estimate human
poses from a set of identity-agnostic keypoints and person center predictions
in an image. Our approach uses a transformer to obtain context-aware embeddings
for all detected keypoints and centers and then applies multi-head attention to
directly group joints into their corresponding person centers. While most
bottom-up methods rely on non-learnable clustering at inference, CenterGroup
uses a fully differentiable attention mechanism that we train end-to-end
together with our keypoint detector. As a result, our method obtains
state-of-the-art performance with up to 2.5x faster inference time than
competing bottom-up methods. Our code is available at
https://github.com/dvl-tum/center-group .
- Abstract(参考訳): 本研究では,身元非依存のキーポイントと人物中心予測のセットから人間のポーズを推定する注意に基づくフレームワークである centergroup を紹介する。
提案手法では,すべての検出されたキーポイントとセンタに対するコンテキスト認識埋め込みをトランスフォーマティブを用いて取得し,その人物センタに対して直接グループジョイントにマルチヘッドアテンションを適用する。
ほとんどのボトムアップメソッドは推論時に無視できないクラスタリングに依存しているが、centergroupはキーポイント検出器と共にエンドツーエンドをトレーニングする、完全に微分可能なアテンションメカニズムを使用している。
その結果,本手法はボトムアップ法に比べて最大2.5倍の速さで最先端性能を得ることができた。
私たちのコードはhttps://github.com/dvl-tum/center-groupで利用可能です。
関連論文リスト
- Dense Center-Direction Regression for Object Counting and Localization with Point Supervision [1.9526430269580954]
本稿では,CeDiRNetと呼ばれる新しい学習手法を提案する。
最寄りの物体中心を向いている方向の高密度な回帰を利用する。
既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-26T17:49:27Z) - Improved Face Representation via Joint Label Classification and
Supervised Contrastive Clustering [5.874142059884521]
顔クラスタリングタスクは、大規模なデータから階層的なセマンティック情報を学ぶことができる。
本稿では,従来の顔認識タスクにクラスタ知識を導入するために,ラベル分類と教師付きコントラストクラスタリングの協調最適化タスクを提案する。
論文 参考訳(メタデータ) (2023-12-07T03:55:20Z) - CenterNet++ for Object Detection [174.59360147041673]
ボトムアップアプローチはトップダウンと同じくらい競争力があり、リコールも高くなります。
CenterNetと呼ばれる我々のアプローチは、各オブジェクトを三重項キーポイント(左上と右下)として検出する。
MS-COCOデータセットでは、Res2Net-101 と Swin-Transformer の CenterNet がそれぞれ 53.7% と 57.1% のAPを達成している。
論文 参考訳(メタデータ) (2022-04-18T16:45:53Z) - Instance-weighted Central Similarity for Multi-label Image Retrieval [66.23348499938278]
ハッシュコードに対応する中心重みを自動的に学習するために,インスタンス重み付き中央類似度(ICS)を提案する。
特にMS COCOデータセットのmAPを1.6%-6.4%改善する。
論文 参考訳(メタデータ) (2021-08-11T15:18:18Z) - Consensus Control for Decentralized Deep Learning [72.50487751271069]
ディープラーニングモデルの分散トレーニングは、ネットワーク上のデバイス上での学習と、大規模計算クラスタへの効率的なスケーリングを可能にする。
理論上、トレーニングコンセンサス距離が重要な量よりも低い場合、分散化されたトレーニングは集中的なトレーニングよりも早く収束することを示す。
私たちの経験的な洞察は、パフォーマンス低下を軽減するために、より分散化されたトレーニングスキームの原則設計を可能にします。
論文 参考訳(メタデータ) (2021-02-09T13:58:33Z) - Attention-Based Clustering: Learning a Kernel from Context [0.0]
本稿では,アテンション・ベース・クラスタリング(ABC)を提案する。
ABCは、入力セット内のコンテキストに適応する潜在表現を学ぶように設計されている。
我々は,Omniglot文字のクラスタリングにおける競合的な結果を示し,クラスタリングにおける注目に基づくアプローチの有効性に関する分析的証拠を含む。
論文 参考訳(メタデータ) (2020-10-02T15:06:06Z) - A Self-Training Approach for Point-Supervised Object Detection and
Counting in Crowds [54.73161039445703]
本稿では,ポイントレベルのアノテーションのみを用いて訓練された典型的なオブジェクト検出を可能にする,新たな自己学習手法を提案する。
トレーニング中、利用可能なポイントアノテーションを使用して、オブジェクトの中心点の推定を監督する。
実験の結果,本手法は検出タスクとカウントタスクの両方において,最先端のポイント管理手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-25T02:14:42Z) - Differentiable Hierarchical Graph Grouping for Multi-Person Pose
Estimation [95.72606536493548]
複数の人の身体のキーポイントを同時にローカライズするため、複数の人物のポーズ推定は困難である。
ボトムアップ型多人数ポーズ推定タスクにおけるグラフグループ化を学習するための,新しい微分可能な階層グラフグループ化(HGG)手法を提案する。
論文 参考訳(メタデータ) (2020-07-23T08:46:22Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。