論文の概要: EfficientHRNet: Efficient Scaling for Lightweight High-Resolution
Multi-Person Pose Estimation
- arxiv url: http://arxiv.org/abs/2007.08090v2
- Date: Wed, 30 Dec 2020 17:43:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 23:00:12.494300
- Title: EfficientHRNet: Efficient Scaling for Lightweight High-Resolution
Multi-Person Pose Estimation
- Title(参考訳): EfficientHRNet:軽量高分解能マルチパーソンポーズ推定のための効率的なスケーリング
- Authors: Christopher Neff, Aneri Sheth, Steven Furgurson, Hamed Tabkhi
- Abstract要約: EfficientHRNetは、リソース制約のあるデバイス上でリアルタイムに動作可能な、軽量な多人数ポーズ推定装置のファミリーである。
最大のモデルは現在の最先端の4.4%の精度で、モデルのサイズは1/3、出力は1/6である。
最上位のリアルタイムアプローチと比較して、EfficientHRNetは22%の精度向上を実現し、1/3のパワーで同様のFPSを実現している。
- 参考スコア(独自算出の注目度): 2.924868086534434
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is an increasing demand for lightweight multi-person pose estimation
for many emerging smart IoT applications. However, the existing algorithms tend
to have large model sizes and intense computational requirements, making them
ill-suited for real-time applications and deployment on resource-constrained
hardware. Lightweight and real-time approaches are exceedingly rare and come at
the cost of inferior accuracy. In this paper, we present EfficientHRNet, a
family of lightweight multi-person human pose estimators that are able to
perform in real-time on resource-constrained devices. By unifying recent
advances in model scaling with high-resolution feature representations,
EfficientHRNet creates highly accurate models while reducing computation enough
to achieve real-time performance. The largest model is able to come within 4.4%
accuracy of the current state-of-the-art, while having 1/3 the model size and
1/6 the computation, achieving 23 FPS on Nvidia Jetson Xavier. Compared to the
top real-time approach, EfficientHRNet increases accuracy by 22% while
achieving similar FPS with 1/3 the power. At every level, EfficientHRNet proves
to be more computationally efficient than other bottom-up 2D human pose
estimation approaches, while achieving highly competitive accuracy.
- Abstract(参考訳): 多くの新興スマートIoTアプリケーションの軽量なマルチパーソンポーズ推定に対する需要が高まっている。
しかし、既存のアルゴリズムは大きなモデルサイズと厳しい計算要求を持ち、リアルタイムアプリケーションやリソース制約のあるハードウェアへのデプロイには不適である。
軽量でリアルタイムなアプローチは極めて稀であり、精度が劣るコストがかかる。
本稿では,リソース制約されたデバイス上でリアルタイムに動作可能な軽量な多人数ポーズ推定装置であるEfficientHRNetを提案する。
EfficientHRNetは、高解像度の特徴表現によるモデルスケーリングの最近の進歩を統合することで、高精度なモデルを作成しながら、リアルタイムのパフォーマンスを達成するのに十分な計算量を削減している。
最大のモデルは現在の最先端の4.4%の精度で、モデルサイズは1/3、計算量は1/6でnvidia jetson xavierでは23fpsとなる。
最上位のリアルタイムアプローチと比較して、EfficientHRNetは22%の精度向上を実現し、1/3のパワーで同様のFPSを実現している。
あらゆるレベルで、効率の良いHRNetは他のボトムアップな2次元ポーズ推定手法よりも計算効率が良く、高い競争精度を実現している。
関連論文リスト
- Taming 3DGS: High-Quality Radiance Fields with Limited Resources [50.92437599516609]
3D Gaussian Splatting (3DGS)は、高速で解釈可能で高忠実なレンダリングで新規ビュー合成を変換した。
予算で3DGSモデルをトレーニングし、レンダリングするという課題に取り組みます。
我々は、勾配計算と属性更新のための高速で数値的に等価な解を導出する。
論文 参考訳(メタデータ) (2024-06-21T20:44:23Z) - Pushing the Limits of Asynchronous Graph-based Object Detection with
Event Cameras [62.70541164894224]
低計算を維持しながら、そのようなモデルの深さと複雑さを拡大できるアーキテクチャ選択をいくつか導入する。
我々の手法は、密度の高いグラフニューラルネットワークよりも3.7倍高速に動作し、前方通過はわずか8.4msである。
論文 参考訳(メタデータ) (2022-11-22T15:14:20Z) - Lite Pose: Efficient Architecture Design for 2D Human Pose Estimation [35.765304656180355]
エッジ上でのリアルタイム多人数ポーズ推定のための効率的なアーキテクチャ設計について検討する。
この発見に触発されて、ポーズ推定のための効率的な単一ブランチアーキテクチャLitePoseを設計した。
本稿では,Fusion Deconv Head や Large Kernel Convs など,LitePose のキャパシティ向上のための2つの簡単なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-03T02:08:04Z) - HRPose: Real-Time High-Resolution 6D Pose Estimation Network Using
Knowledge Distillation [0.0]
本稿では,高分解能6D Pose Estimation Network (HRPose) の有効かつ軽量なモデルを提案する。
モデルサイズと計算コストの33%しかありませんが、HRPoseは最先端モデルと比較して同等のパフォーマンスを実現しています。
広範に使用されているベンチマーク LINEMOD の数値実験により,提案した HRPose の最先端手法に対する優位性を実証した。
論文 参考訳(メタデータ) (2022-04-20T12:43:39Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Effective Model Sparsification by Scheduled Grow-and-Prune Methods [73.03533268740605]
本稿では,高密度モデルの事前学習を伴わない新規なGrow-and-prune(GaP)手法を提案する。
実験により、そのようなモデルは様々なタスクにおいて80%の間隔で高度に最適化された高密度モデルの品質に適合または打ち勝つことができることが示された。
論文 参考訳(メタデータ) (2021-06-18T01:03:13Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy [49.3037538647714]
本稿では,リソース制約のあるハードウェア上での効率的なディープラーニング推論のためのAPQを提案する。
ニューラルアーキテクチャ、プルーニングポリシー、量子化ポリシーを別々に検索する従来の方法とは異なり、我々はそれらを共同で最適化する。
同じ精度で、APQはMobileNetV2+HAQよりもレイテンシ/エネルギーを2倍/1.3倍削減する。
論文 参考訳(メタデータ) (2020-06-15T16:09:17Z) - EfficientPose: Scalable single-person pose estimation [3.325625311163864]
一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
論文 参考訳(メタデータ) (2020-04-25T16:50:46Z) - FADNet: A Fast and Accurate Network for Disparity Estimation [18.05392578461659]
本研究では,FADNetという分散度推定のための効率的かつ高精度なディープネットワークを提案する。
高速な計算を保存するために、2Dベースの効率的な相関層と積み重ねブロックを利用する。
精度を向上させるために、マルチスケールの重みスケジューリングトレーニング技術を活用するために、マルチスケールの予測を含んでいる。
論文 参考訳(メタデータ) (2020-03-24T10:27:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。