論文の概要: Keypoints as Dynamic Centroids for Unified Human Pose and Segmentation
- arxiv url: http://arxiv.org/abs/2505.12130v1
- Date: Sat, 17 May 2025 20:05:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.055121
- Title: Keypoints as Dynamic Centroids for Unified Human Pose and Segmentation
- Title(参考訳): 動的セントロイドとしてのキーポイント : 統一された人間詩とセグメンテーション
- Authors: Niaz Ahmad, Jawad Khan, Kang G. Shin, Youngmoon Lee, Guanghui Wang,
- Abstract要約: Keypoints as Dynamic Centroid (KDC)は、統合された人間のポーズ推定とインスタンスレベルのセグメンテーションのための、新しいセントロイドベースの表現である。
KDCはボトムアップのパラダイムを採用し、容易に区別できるキーポイントと複雑なキーポイントの両方にキーポイントのヒートマップを生成する。
高信頼のキーポイントを埋め込み空間の動的セントロイドとして利用し、MaskCentroidを生成する。
- 参考スコア(独自算出の注目度): 19.109607441709418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The dynamic movement of the human body presents a fundamental challenge for human pose estimation and body segmentation. State-of-the-art approaches primarily rely on combining keypoint heatmaps with segmentation masks but often struggle in scenarios involving overlapping joints or rapidly changing poses during instance-level segmentation. To address these limitations, we propose Keypoints as Dynamic Centroid (KDC), a new centroid-based representation for unified human pose estimation and instance-level segmentation. KDC adopts a bottom-up paradigm to generate keypoint heatmaps for both easily distinguishable and complex keypoints and improves keypoint detection and confidence scores by introducing KeyCentroids using a keypoint disk. It leverages high-confidence keypoints as dynamic centroids in the embedding space to generate MaskCentroids, allowing for swift clustering of pixels to specific human instances during rapid body movements in live environments. Our experimental evaluations on the CrowdPose, OCHuman, and COCO benchmarks demonstrate KDC's effectiveness and generalizability in challenging scenarios in terms of both accuracy and runtime performance. The implementation is available at: https://sites.google.com/view/niazahmad/projects/kdc.
- Abstract(参考訳): 人間の身体のダイナミックな動きは、人間のポーズ推定と身体のセグメンテーションに根本的な課題をもたらす。
最先端のアプローチは主にキーポイントのヒートマップとセグメンテーションマスクを組み合わせることに依存しているが、多くの場合、重なり合うジョイントや、インスタンスレベルのセグメンテーション中に急速に変化するポーズを含むシナリオで苦労する。
これらの制約に対処するために,キーポイント・アズ・ダイナミック・センタロイド(KDC)を提案する。
KDCはボトムアップパラダイムを採用し、キーポイントと複雑なキーポイントの両方でキーポイントのヒートマップを生成し、キーポイントディスクを使用したキーセントロイドの導入によってキーポイントの検出と信頼性スコアを改善する。
高信頼のキーポイントを埋め込み空間のダイナミックセントロイドとして利用し、MaskCentroidsを生成する。
CrowdPose、OCHuman、COCOベンチマークに関する実験的な評価は、KDCの精度と実行時性能の両方の観点から、挑戦的なシナリオにおける有効性と一般化性を示している。
実装は以下の通りである。 https://sites.google.com/view/niazahmad/projects/kdc。
関連論文リスト
- VISUALCENT: Visual Human Analysis using Dynamic Centroid Representation [8.486534291290559]
視覚的多面解析における汎用性とスケーラビリティの限界に対処する統合されたヒューマンポーズとインスタンスセグメンテーションフレームワークであるVISUALCENTを紹介する。
統一セグメンテーションタスクでは、明示的なキーポイントがMaskCentroidと呼ばれるダイナミックなセントロイドとして定義され、人体の動きの急速な変化や環境が著しく閉鎖されたときに、特定の人間のインスタンスに素早くピクセルをクラスタ化する。
COCOとOCHumanデータセットの実験結果は、VISUALCENTsの精度と実時間性能の利点を示し、mAPスコアの既存の手法と毎秒の実行フレームレートを上回っている。
論文 参考訳(メタデータ) (2025-04-26T21:58:56Z) - Robust Human Registration with Body Part Segmentation on Noisy Point Clouds [73.00876572870787]
メッシュフィッティングプロセスにボディ部分のセグメンテーションを組み込んだハイブリッドアプローチを導入する。
本手法はまず,まず各点にボディ部ラベルを割り当て,次に2ステップのSMPL-Xフィッティングを導出する。
装着された人間のメッシュは、ボディ部分のラベルを洗練し、セグメンテーションの改善につながることを実証する。
論文 参考訳(メタデータ) (2025-04-04T17:17:33Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - MDPose: Real-Time Multi-Person Pose Estimation via Mixture Density Model [27.849059115252008]
本稿では,人間のキーポイントの結合分布をモデル化し,一段階のインスタンス認識ポーズ推定手法を提案する。
我々のMDPoseは、人間のキーポイントの高次元の関節分布を学習し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-02-17T08:29:33Z) - Spatiotemporal k-means [39.98633724527769]
マルチスケールクラスタを解析できるk-means (STk) と呼ばれる2つの時間クラスタリング手法を提案する。
我々は、STkMがより複雑な機械学習タスク、特にビデオにおける関心の検出と追跡の教師なし領域にどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-11-10T04:40:31Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - The Center of Attention: Center-Keypoint Grouping via Attention for
Multi-Person Pose Estimation [0.0]
CenterGroupは、画像内のアイデンティティに依存しないキーポイントと人中心予測のセットから人間のポーズを推定する注意ベースのフレームワークである。
提案手法は、競合するボトムアップ法よりも2.5倍高速な推論時間を有する最先端性能を得る。
論文 参考訳(メタデータ) (2021-10-11T10:22:04Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。