論文の概要: EfficientPose: Scalable single-person pose estimation
- arxiv url: http://arxiv.org/abs/2004.12186v2
- Date: Fri, 4 Dec 2020 09:27:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 21:44:12.097138
- Title: EfficientPose: Scalable single-person pose estimation
- Title(参考訳): EfficientPose: スケーラブルなシングルパーソンポーズ推定
- Authors: Daniel Groos, Heri Ramampiaro, Espen A. F. Ihlen
- Abstract要約: 一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
- 参考スコア(独自算出の注目度): 3.325625311163864
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-person human pose estimation facilitates markerless movement analysis
in sports, as well as in clinical applications. Still, state-of-the-art models
for human pose estimation generally do not meet the requirements of real-life
applications. The proliferation of deep learning techniques has resulted in the
development of many advanced approaches. However, with the progresses in the
field, more complex and inefficient models have also been introduced, which
have caused tremendous increases in computational demands. To cope with these
complexity and inefficiency challenges, we propose a novel convolutional neural
network architecture, called EfficientPose, which exploits recently proposed
EfficientNets in order to deliver efficient and scalable single-person pose
estimation. EfficientPose is a family of models harnessing an effective
multi-scale feature extractor and computationally efficient detection blocks
using mobile inverted bottleneck convolutions, while at the same time ensuring
that the precision of the pose configurations is still improved. Due to its low
complexity and efficiency, EfficientPose enables real-world applications on
edge devices by limiting the memory footprint and computational cost. The
results from our experiments, using the challenging MPII single-person
benchmark, show that the proposed EfficientPose models substantially outperform
the widely-used OpenPose model both in terms of accuracy and computational
efficiency. In particular, our top-performing model achieves state-of-the-art
accuracy on single-person MPII, with low-complexity ConvNets.
- Abstract(参考訳): 一人称人間のポーズ推定は、スポーツにおけるマーカーレス運動分析と臨床応用を促進する。
それでも、人間のポーズ推定の最先端モデルは、一般に実際の応用の要件を満たしていない。
深層学習技術の普及は、多くの先進的なアプローチを生み出した。
しかし、この分野の進展に伴い、より複雑で非効率なモデルも導入され、計算要求が大幅に増加した。
このような複雑で非効率な課題に対処するため,我々は,最近提案されている効率性ネットを活用し,効率的かつスケーラブルな一人称ポーズ推定を実現する,新しい畳み込みニューラルネットワークアーキテクチャである efficientpose を提案する。
efficientposeは、モバイル逆ボトルネック畳み込みを用いた効果的なマルチスケール特徴抽出器と計算効率の高い検出ブロックを活用したモデル群であると同時に、ポーズ構成の精度も向上している。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
実験の結果,MPIIシングルパーソンベンチマークを用いた結果,提案したEfficientPoseモデルは,精度と計算効率の両面で広く使用されているOpenPoseモデルより大幅に優れていることがわかった。
特に,我々のトップパフォーマンスモデルでは,低複雑さのConvNetを用いて,シングルパーソンMPIIにおける最先端の精度を実現している。
関連論文リスト
- On-Chip Hardware-Aware Quantization for Mixed Precision Neural Networks [52.97107229149988]
エッジデバイス上でハードウェア対応の混合精度量子化を行うOn-Chipハードウェア・アウェア量子化フレームワークを提案する。
このパイプラインは、量子化プロセスが量子化演算子の実際のハードウェア効率を知覚することを可能にする。
精度測定のために,マルチチップシナリオにおける演算子の精度への影響を効果的に推定するMask-Guided Quantization Estimation技術を提案する。
論文 参考訳(メタデータ) (2023-09-05T04:39:34Z) - ParaFormer: Parallel Attention Transformer for Efficient Feature
Matching [8.552303361149612]
本稿ではParaFormerという新しい並列アテンションモデルを提案する。
振幅と位相という概念を通じて特徴とキーポイントの位置を融合させ、平行して自己と横断性を統合する。
ホモグラフィー推定、ポーズ推定、画像マッチングなど様々な応用実験により、ParaFormerが最先端の性能を達成することを示す。
効率のよいParaFormer-Uは、既存のアテンションベースモデルの50%未満のFLOPで同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-03-02T03:29:16Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - MoEfication: Conditional Computation of Transformer Models for Efficient
Inference [66.56994436947441]
トランスフォーマーベースの事前学習言語モデルは、パラメータ容量が大きいため、ほとんどのNLPタスクにおいて優れた性能を実現することができるが、計算コストも大きい。
スパースアクティベーション現象に基づく条件計算により,大規模モデル推論を高速化する。
そこで本研究では,モデルサイズが等しいMoE(Mix-of-experts)バージョン,すなわちMoEficationに変換することを提案する。
論文 参考訳(メタデータ) (2021-10-05T02:14:38Z) - A Step Towards Efficient Evaluation of Complex Perception Tasks in
Simulation [5.4954641673299145]
単純化された低忠実度シミュレータを用いて,効率的な大規模テストを実現する手法を提案する。
我々のアプローチは、テスト中のタスクの計算集約的なコンポーネントに対応する効率的なサロゲートモデルを設計することに依存している。
計算コストを削減したCarlaシミュレータにおける自律運転タスクの性能を評価することで,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-09-28T13:50:21Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - Single upper limb pose estimation method based on improved stacked
hourglass network [5.342260499725028]
一人称ポーズ推定において高精度かつリアルタイムなパフォーマンスを実現することは困難である。
本稿では,エンド・ツー・エンドアプローチに基づく一人称上肢ポーズ推定手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T04:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。