論文の概要: Composite Localization for Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2105.07245v1
- Date: Sat, 15 May 2021 15:22:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-05-18 15:07:47.232997
- Title: Composite Localization for Human Pose Estimation
- Title(参考訳): ポーズ推定のための複合位置推定
- Authors: ZiFan Chen, Xin Qin, Chao Yang, Li Zhang
- Abstract要約: 本研究は,合成局所化と呼ばれる人間のポーズ推定のための新しい深層学習フレームワークを提案する。
CLNet-ResNetとCLNet-Hourglassの2種類の複合ローカリゼーションネットワークを構築します。
実験の結果,CLNet-ResNet50はSimpleBaselineを約1/2 GFLOPで1.14%上回っていることがわかった。
- 参考スコア(独自算出の注目度): 9.416614414209777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The existing human pose estimation methods are confronted with inaccurate
long-distance regression or high computational cost due to the complex learning
objectives. This work proposes a novel deep learning framework for human pose
estimation called composite localization to divide the complex learning
objective into two simpler ones: a sparse heatmap to find the keypoint's
approximate location and two short-distance offsetmaps to obtain its final
precise coordinates. To realize the framework, we construct two types of
composite localization networks: CLNet-ResNet and CLNet-Hourglass. We evaluate
the networks on three benchmark datasets, including the Leeds Sports Pose
dataset, the MPII Human Pose dataset, and the COCO keypoints detection dataset.
The experimental results show that our CLNet-ResNet50 outperforms
SimpleBaseline by 1.14% with about 1/2 GFLOPs. Our CLNet-Hourglass outperforms
the original stacked-hourglass by 4.45% on COCO.
- Abstract(参考訳): 既存の人間のポーズ推定手法は、複雑な学習目的のために不正確な長距離回帰や高い計算コストに直面している。
本研究では,複雑な学習対象を,キーポイントの近似位置を求めるスパースヒートマップと,その最終的な正確な座標を得るための2つの短距離オフセットマップという,2つの単純なものに分割するために,複合的位置推定と呼ばれる新しい深層学習フレームワークを提案する。
このフレームワークを実現するために,CLNet-ResNetとCLNet-Hourglassの2種類の複合ローカライゼーションネットワークを構築した。
我々は、Leeds Sports Poseデータセット、MPII Human Poseデータセット、COCOキーポイント検出データセットを含む3つのベンチマークデータセットでネットワークを評価した。
実験の結果,CLNet-ResNet50はSimpleBaselineを約1/2 GFLOPで1.14%上回っていることがわかった。
当社のCLNet-Hourglassは、COCOの4.45%を上回りました。
関連論文リスト
- PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR
Point Clouds [29.15589024703907]
本稿では,計算資源の割り当ての観点から,局所的な点集合体を再考する。
最も単純な柱ベースのモデルは、精度とレイテンシの両方を考慮して驚くほどよく機能することがわかった。
本研究は,3次元物体検出の高性能化のために,詳細な幾何学的モデリングが不可欠である,という一般的な直観に挑戦する。
論文 参考訳(メタデータ) (2023-05-08T17:59:14Z) - DCL-Net: Deep Correspondence Learning Network for 6D Pose Estimation [43.963630959349885]
本稿では,DCL-Netとして短縮された直接6次元オブジェクトポーズ推定のためのディープ対応学習ネットワークを提案する。
DCL-Netは,YCB-Video,LineMOD,Oclussion-LineMODを含む3つのベンチマークデータセットにおいて,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:04:40Z) - S$^2$Contact: Graph-based Network for 3D Hand-Object Contact Estimation
with Semi-Supervised Learning [70.72037296392642]
モノクロ画像から接触を学習できる新しい半教師付きフレームワークを提案する。
具体的には、大規模データセットにおける視覚的および幾何学的整合性制約を利用して擬似ラベルを生成する。
より正確な再構築を行うために手動インタラクションを規定するコンタクトマップを使用することの利点を示す。
論文 参考訳(メタデータ) (2022-08-01T14:05:23Z) - BiCo-Net: Regress Globally, Match Locally for Robust 6D Pose Estimation [32.49091033895255]
双方向対応マッピングネットワーク(BiCo-Net)は、典型的なポーズ回帰によって導かれる点雲を生成する。
局所的マッチングと直接ポーズ回帰による冗長なポーズ予測のアンサンブルは、ノイズ観測に対する最終的なポーズ出力をさらに洗練する。
論文 参考訳(メタデータ) (2022-05-07T03:37:33Z) - Rethinking Counting and Localization in Crowds:A Purely Point-Based
Framework [59.578339075658995]
そこで本稿では,共同クラウドカウントと個別ローカライゼーションのための純粋にポイントベースのフレームワークを提案する。
我々は、P2PNet(Point to Point Network)と呼ばれる、このフレームワークの下で直感的なソリューションを設計する。
論文 参考訳(メタデータ) (2021-07-27T11:41:50Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - Location-Sensitive Visual Recognition with Cross-IOU Loss [177.86369890708457]
本稿では,オブジェクト検出,インスタンスセグメンテーション,ポーズ推定のための位置感知ネットワーク (LSNet) という統合ソリューションを提案する。
ディープニューラルネットワークをバックボーンとして、LSNetは、ターゲットオブジェクトの形状を一緒に定義するアンカーポイントとランドマークのセットを予測します。
論文 参考訳(メタデータ) (2021-04-11T02:17:14Z) - SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine
Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。
本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。
本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-08T14:14:09Z) - Graph-PCNN: Two Stage Human Pose Estimation with Graph Pose Refinement [54.29252286561449]
グラフPCNNと呼ばれる2段階のグラフベースおよびモデルに依存しないフレームワークを提案する。
第1段階では、粗局化結果を得るために熱マップ回帰ネットワークを適用し、ガイドポイントと呼ばれる一連の提案キーポイントをサンプリングする。
第2段階では、各案内点について、ローカライゼーションにより異なる視覚特徴を抽出する。
ガイドされた点間の関係は、より正確なローカライゼーション結果を得るためにグラフポーズ精製モジュールによって探索される。
論文 参考訳(メタデータ) (2020-07-21T04:59:15Z) - G2L-Net: Global to Local Network for Real-time 6D Pose Estimation with
Embedding Vector Features [39.77987181390717]
本稿では,G2L-Netという新しいリアルタイム6次元オブジェクトポーズ推定フレームワークを提案する。
我々のネットワークは、RGB-D検出の点雲を分割・分散方式で運用している。
G2L-Netは精度と速度の両面で最先端の性能を達成する。
論文 参考訳(メタデータ) (2020-03-24T19:42:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。