論文の概要: Towards Fast and Accurate Multi-Person Pose Estimation on Mobile Devices
- arxiv url: http://arxiv.org/abs/2106.15304v1
- Date: Sun, 6 Jun 2021 22:39:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-05 00:36:09.864250
- Title: Towards Fast and Accurate Multi-Person Pose Estimation on Mobile Devices
- Title(参考訳): モバイルデバイス上での高速かつ正確なマルチパーソンポース推定に向けて
- Authors: Xuan Shen, Geng Yuan, Wei Niu, Xiaolong Ma, Jiexiong Guan, Zhengang
Li, Bin Ren and Yanzhi Wang
- Abstract要約: 本稿では,モバイルデバイス上での多人数ポーズ推定を高速化するアーキテクチャ最適化と重み付けフレームワークを提案する。
提案フレームワークでは,代表的軽量多人数ポーズ推定器と比較して,最大2.51倍の精度でモデル推論速度を実現する。
- 参考スコア(独自算出の注目度): 26.053147039816707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid development of autonomous driving, abnormal behavior detection, and
behavior recognition makes an increasing demand for multi-person pose
estimation-based applications, especially on mobile platforms. However, to
achieve high accuracy, state-of-the-art methods tend to have a large model size
and complex post-processing algorithm, which costs intense computation and long
end-to-end latency. To solve this problem, we propose an architecture
optimization and weight pruning framework to accelerate inference of
multi-person pose estimation on mobile devices. With our optimization
framework, we achieve up to 2.51x faster model inference speed with higher
accuracy compared to representative lightweight multi-person pose estimator.
- Abstract(参考訳): 自律運転、異常行動検出、行動認識の急速な発展により、多人数のポーズ推定に基づくアプリケーション、特にモバイルプラットフォームへの需要が高まっている。
しかし、高い精度を達成するために、最先端の手法は大きなモデルサイズと複雑な後処理アルゴリズムを持つ傾向があり、高い計算と長いエンドツーエンドのレイテンシがかかる。
そこで本研究では,モバイルデバイス上での多人数ポーズ推定を高速化するアーキテクチャ最適化と重み付けフレームワークを提案する。
最適化フレームワークにより、代表的軽量多人数ポーズ推定器に比べて精度の高いモデル推論速度を最大2.51倍に向上する。
関連論文リスト
- Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.27022390372502]
我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。
その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文 参考訳(メタデータ) (2024-09-24T14:58:27Z) - Efficient Human Pose Estimation: Leveraging Advanced Techniques with MediaPipe [5.439359582541082]
本研究では,MediaPipeフレームワークを用いた人間のポーズ推定の大幅な向上について述べる。
この研究は精度、計算効率、リアルタイム処理能力の改善に焦点を当てている。
この進歩は、拡張現実、スポーツ分析、ヘルスケアに幅広く応用されている。
論文 参考訳(メタデータ) (2024-06-21T21:00:45Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - On Efficient Uncertainty Estimation for Resource-Constrained Mobile
Applications [0.0]
予測の不確実性は、モデル予測を補完し、下流タスクの機能を改善します。
Axolotlフレームワークを用いてモンテカルロ・ドロップアウト(MCDO)モデルを構築することでこの問題に対処する。
我々は,(1)CIFAR10データセットを用いた多クラス分類タスク,(2)より複雑な人体セグメンテーションタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-11-11T22:24:15Z) - Data-Driven Offline Optimization For Architecting Hardware Accelerators [89.68870139177785]
PRIMEと呼ばれるハードウェアアクセラレータを設計するための,データ駆動型オフライン最適化手法を開発した。
PRIMEは、最先端のシミュレーション駆動方式の性能を約1.54倍と1.20倍に改善し、必要な総シミュレーション時間をそれぞれ93%と99%削減する。
さらにPRIMEは、ゼロショット設定で見えないアプリケーションのための効果的なアクセラレーターを設計し、シミュレーションベースの手法を1.26倍に向上させた。
論文 参考訳(メタデータ) (2021-10-20T17:06:09Z) - Multi-Modal Temporal Convolutional Network for Anticipating Actions in
Egocentric Videos [22.90184887794109]
正確だが十分に速くないメソッドは、意思決定プロセスに高いレイテンシをもたらす。
これは、反応時間が重要である自律運転のようなドメインに問題を引き起こす。
本稿では,時間的畳み込みに基づくシンプルで効果的なマルチモーダルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-18T16:21:35Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - EfficientPose: Scalable single-person pose estimation [3.325625311163864]
一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
論文 参考訳(メタデータ) (2020-04-25T16:50:46Z) - Catch the Ball: Accurate High-Speed Motions for Mobile Manipulators via
Inverse Dynamics Learning [20.655003319777368]
移動マニピュレータは、スローモーションコラボレーティブロボットシナリオにデプロイされる。
本稿では,高精度な高速動作を必要とするシナリオについて考察する。
2つの主要コンポーネントを含むこのタスク体制のためのフレームワークを導入する。
論文 参考訳(メタデータ) (2020-03-17T01:33:07Z) - A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration
Framework [56.57225686288006]
モバイルエッジデバイスの限られたストレージとコンピューティング能力を満たすために、ディープニューラルネットワーク(DNN)の軽量プルーニングが提案されている。
従来のプルーニング手法は主に、ユーザデータのプライバシを考慮せずに、モデルのサイズを減らしたり、パフォーマンスを向上させることに重点を置いていた。
プライベートトレーニングデータセットを必要としないプライバシ保護指向のプルーニングおよびモバイルアクセラレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T23:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。