論文の概要: Joint Multi-Person Body Detection and Orientation Estimation via One
Unified Embedding
- arxiv url: http://arxiv.org/abs/2210.15586v1
- Date: Thu, 27 Oct 2022 16:22:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 14:38:10.566505
- Title: Joint Multi-Person Body Detection and Orientation Estimation via One
Unified Embedding
- Title(参考訳): 1つの統一埋め込みによる多人数共同身体検出と方向推定
- Authors: Huayi Zhou, Fei Jiang, Jiaxin Si, Hongtao Lu
- Abstract要約: 本論文では,HBOE問題に多人数で対処するための一段階のエンドツーエンドトレーニング可能なフレームワークを提案する。
本手法は,1つの埋め込みにボックスと方向角の予測を組み込むことで,すべての物体の位置と方向を1つの画像内に共同で推定することができる。
- 参考スコア(独自算出の注目度): 24.96237908232171
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human body orientation estimation (HBOE) is widely applied into various
applications, including robotics, surveillance, pedestrian analysis and
autonomous driving. Although many approaches have been addressing the HBOE
problem from specific under-controlled scenes to challenging in-the-wild
environments, they assume human instances are already detected and take a well
cropped sub-image as the input. This setting is less efficient and prone to
errors in real application, such as crowds of people. In the paper, we propose
a single-stage end-to-end trainable framework for tackling the HBOE problem
with multi-persons. By integrating the prediction of bounding boxes and
direction angles in one embedding, our method can jointly estimate the location
and orientation of all bodies in one image directly. Our key idea is to
integrate the HBOE task into the multi-scale anchor channel predictions of
persons for concurrently benefiting from engaged intermediate features.
Therefore, our approach can naturally adapt to difficult instances involving
low resolution and occlusion as in object detection. We validated the
efficiency and effectiveness of our method in the recently presented benchmark
MEBOW with extensive experiments. Besides, we completed ambiguous instances
ignored by the MEBOW dataset, and provided corresponding weak body-orientation
labels to keep the integrity and consistency of it for supporting studies
toward multi-persons. Our work is available at
\url{https://github.com/hnuzhy/JointBDOE}.
- Abstract(参考訳): 人体方向推定(hboe)はロボット工学、サーベイランス、歩行者分析、自動運転など様々な応用に広く適用されている。
特定の制御下のシーンから野生環境への挑戦まで、多くのアプローチがhboe問題に取り組んできたが、彼らは人間のインスタンスが既に検出されており、入力として十分に切り抜かれたサブイメージを取ると仮定している。
この設定は効率が低く、大勢の人のような実際のアプリケーションでエラーが発生しやすい。
本稿では,複数人でhboe問題に取り組むための,エンドツーエンドでトレーニング可能なフレームワークを提案する。
本手法は,1つの埋め込みにボックスと方向角の予測を組み込むことで,各物体の位置と方向を1つの画像に直接推定することができる。
我々のキーとなる考え方は、HBOEタスクを、係わる中間機能から同時に恩恵を受ける人々のマルチスケールアンカーチャネル予測に統合することである。
したがって,物体検出のように低分解能と閉塞を伴う難易度に自然に適応できる。
最近発表されたベンチマークMEBOWにおいて,提案手法の有効性と有効性を検証した。
さらに,mebowデータセットによって無視された曖昧なインスタンスを完了し,それに対応する弱いボディオリエンテーションラベルを提供し,複数人を対象とした研究を支援する。
私たちの作品は \url{https://github.com/hnuzhy/jointbdoe} で入手できる。
関連論文リスト
- Unified Domain Generalization and Adaptation for Multi-View 3D Object Detection [14.837853049121687]
マルチビューカメラを利用した3次元物体検出は, 視覚課題における実用的, 経済的価値を実証した。
典型的な教師付き学習アプローチは、目に見えない、ラベルなしのターゲットデータセットに対する満足な適応を達成する上で、課題に直面します。
本稿では、これらの欠点を軽減するための実践的なソリューションとして、統一ドメイン一般化・適応(UDGA)を提案する。
論文 参考訳(メタデータ) (2024-10-29T18:51:49Z) - PBADet: A One-Stage Anchor-Free Approach for Part-Body Association [30.6652836585336]
PBADetは、部分体アソシエーション検出のための1段階のアンカーフリーアプローチである。
私たちのデザインは本質的に汎用的で、複数のパーツ間の関連を管理することができます。
論文 参考訳(メタデータ) (2024-02-12T17:18:51Z) - Generalizable Person Search on Open-world User-Generated Video Content [93.72028298712118]
人物の検索は、大量の露骨なシーン画像から個人を検索する、困難な作業である。
既存の人検索アプリケーションは、ほとんどトレーニングされ、同じシナリオにデプロイされます。
本稿では,任意のシナリオにおける下流タスクを容易にするために,特徴レベルとデータレベルの両方の一般化可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-16T04:59:50Z) - Multi-view Tracking Using Weakly Supervised Human Motion Prediction [60.972708589814125]
さらに効果的なアプローチは、時間とともに人々の動きを予測し、それらから個々のフレームにおける人々の存在を推定することである、と我々は主張する。
これにより、時間とともに、また1つの時間フレームのビューにわたって一貫性を強制できる。
PETS2009およびWILDTRACKデータセットに対する我々のアプローチを検証するとともに、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-19T17:58:23Z) - InsPose: Instance-Aware Networks for Single-Stage Multi-Person Pose
Estimation [37.80984212500406]
本稿では,インスタンス認識型動的ネットワークを用いて,シンプルで効果的な解を提案する。
具体的には、各インスタンスのネットワークパラメータを適応的に(一部)調整するインスタンス対応モジュールを提案する。
我々のソリューションは、コンパクトなエンドツーエンドのトレーニング可能なパイプラインを維持しながら、様々なポーズを認識するためのネットワークの容量と適応性を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-07-19T15:56:09Z) - A Global to Local Double Embedding Method for Multi-person Pose
Estimation [10.05687757555923]
本稿では,人検出と関節検出を同時に行うことにより,パイプラインを簡素化する新しい手法を提案する。
マルチパーソンポーズ推定タスクをグローバルからローカルに完了するダブルエンベディング(DE)手法を提案する。
MSCOCO, MPII および CrowdPose のベンチマークを用いて,本手法の有効性と一般化能力を示す。
論文 参考訳(メタデータ) (2021-02-15T03:13:38Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - DIRV: Dense Interaction Region Voting for End-to-End Human-Object
Interaction Detection [53.40028068801092]
本稿では,HOI問題に対するインタラクション領域という新しい概念に基づいて,新しい一段階HOI検出手法を提案する。
従来の手法とは異なり,本手法は人-物対ごとに異なるスケールにわたる密集した相互作用領域に焦点をあてる。
単一相互作用領域の検出欠陥を補うために,我々は新しい投票戦略を導入する。
論文 参考訳(メタデータ) (2020-10-02T13:57:58Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。