論文の概要: SDR-GAIN: A High Real-Time Occluded Pedestrian Pose Completion Method
for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2306.03538v2
- Date: Sat, 10 Jun 2023 15:31:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 23:05:16.153419
- Title: SDR-GAIN: A High Real-Time Occluded Pedestrian Pose Completion Method
for Autonomous Driving
- Title(参考訳): SDR-GAIN: 自動走行のための高リアルタイムOccluded Pedestrian Pose Completion法
- Authors: Honghao Fu, Libo Sun
- Abstract要約: 本稿では,SDR-GAIN(SDR-GAIN)と呼ばれる新規な歩行者ポーズキーポイント完了手法を提案する。
SDR-GAINアルゴリズムは、約0.4msの驚くほど短い実行時間を示し、例外的なリアルタイム性能を誇っている。
- 参考スコア(独自算出の注目度): 0.22843885788439797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To mitigate the challenges arising from partial occlusion in human pose
keypoint based pedestrian detection methods , we present a novel pedestrian
pose keypoint completion method called the separation and dimensionality
reduction-based generative adversarial imputation networks (SDR-GAIN). Firstly,
we utilize OpenPose to estimate pedestrian poses in images. Then, we isolate
the head and torso keypoints of pedestrians with incomplete keypoints due to
occlusion or other factors and perform dimensionality reduction to enhance
features and further unify feature distribution. Finally, we introduce two
generative models based on the generative adversarial networks (GAN) framework,
which incorporate Huber loss, residual structure, and L1 regularization to
generate missing parts of the incomplete head and torso pose keypoints of
partially occluded pedestrians, resulting in pose completion. Our experiments
on MS COCO and JAAD datasets demonstrate that SDR-GAIN outperforms basic GAIN
framework, interpolation methods PCHIP and MAkima, machine learning methods
k-NN and MissForest in terms of pose completion task. Furthermore, the SDR-GAIN
algorithm exhibits a remarkably short running time of approximately 0.4ms and
boasts exceptional real-time performance. As such, it holds significant
practical value in the domain of autonomous driving, wherein high system
response speeds are of paramount importance. Specifically, it excels at rapidly
and precisely capturing human pose key points, thus enabling an expanded range
of applications for pedestrian detection tasks based on pose key points,
including but not limited to pedestrian behavior recognition and prediction.
- Abstract(参考訳): 本研究では,人間のポーズキーポイントに基づく歩行者検出手法における部分閉塞から生じる課題を軽減するために,分割・次元減少に基づく生成逆計算ネットワーク(SDR-GAIN)と呼ばれる新しい歩行者ポーズキーポイント完了手法を提案する。
まず、OpenPoseを使って画像中の歩行者のポーズを推定する。
そして,閉塞などの要因により不完全な鍵点を持つ歩行者の頭と胴のキーポイントを分離し,次元的削減を行い,特徴量を高め,さらに特徴分布を統一する。
最後に, フーバー損失, 残差構造, l1正規化を組み込んだgenerative adversarial networks (gan) フレームワークに基づく生成モデルについて紹介する。
我々は,MS COCOとJAADデータセットを用いて,SDR-GAINが基本的なGAINフレームワーク,PCHIPとMAKIMA,機械学習手法k-NN,MissForestをポーズ完了タスクで上回ることを示す。
さらに、SDR-GAINアルゴリズムは、約0.4msの驚くほど短い実行時間を示し、例外的なリアルタイム性能を誇っている。
このように、自律運転の分野では、高いシステム応答速度が最重要となる重要な実践的価値を持っている。
具体的には、人間のポーズキーポイントを迅速かつ正確に捉えることに優れており、歩行者の行動認識や予測に限らず、ポーズキーポイントに基づく歩行者検出タスクの幅広い応用が可能となる。
関連論文リスト
- Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.569646683579899]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:29:05Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - MDPose: Real-Time Multi-Person Pose Estimation via Mixture Density Model [27.849059115252008]
本稿では,人間のキーポイントの結合分布をモデル化し,一段階のインスタンス認識ポーズ推定手法を提案する。
我々のMDPoseは、人間のキーポイントの高次元の関節分布を学習し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-02-17T08:29:33Z) - 2D Human Pose Estimation with Explicit Anatomical Keypoints Structure
Constraints [15.124606575017621]
本稿では,解剖学的キーポイント構造制約を明示した新しい2次元ポーズ推定手法を提案する。
提案手法は,既存のボトムアップやトップダウンの人間のポーズ推定手法に組み込むことができる。
提案手法は,既存のボトムアップとトップダウンの人間のポーズ推定手法に対して良好に機能する。
論文 参考訳(メタデータ) (2022-12-05T11:01:43Z) - AlphaPose: Whole-Body Regional Multi-Person Pose Estimation and Tracking
in Real-Time [47.19339667836196]
提案するAlphaPoseは,リアルタイムに動作しながら,身体全体のポーズを正確に推定・追跡できるシステムである。
我々は,COCO-全体,COCO,PoseTrack,提案したHalpe-FullBodyポーズ推定データセットにおいて,現在の最先端手法よりも高速かつ高精度であることを示す。
論文 参考訳(メタデータ) (2022-11-07T09:15:38Z) - Direct Dense Pose Estimation [138.56533828316833]
複雑な人間のポーズ推定は、RGB画像と人体の表面との密接な対応を学習する問題である。
従来より密集したポーズ推定手法は、すべてMask R-CNNフレームワークに基づいており、まず各人物のバウンディングボックスを識別しようとするトップダウン方式で動作している。
そこで我々は,DDP (Direct Dense Pose) という,高密度ポーズ推定問題の解法を提案する。
論文 参考訳(メタデータ) (2022-04-04T06:14:38Z) - Quality-aware Part Models for Occluded Person Re-identification [77.24920810798505]
咬合は人体再識別(ReID)にとって大きな課題となる
既存のアプローチは一般的に、計算効率とReIDの精度の両面で最適であるように、目に見える身体の部品を推測するための外部ツールに依存している。
閉塞型ReIDのためのQPM(Quality-Aware Part Models)という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:51:09Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。