論文の概要: Lightweight Human Pose Estimation Using Heatmap-Weighting Loss
- arxiv url: http://arxiv.org/abs/2205.10611v1
- Date: Sat, 21 May 2022 14:26:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 14:11:33.527339
- Title: Lightweight Human Pose Estimation Using Heatmap-Weighting Loss
- Title(参考訳): ヒートマップ重み付け損失を用いた軽量ポーズ推定
- Authors: Shiqi Li, Xiang Xiang
- Abstract要約: 本稿では,原位置情報,レベル間情報,レベル内情報を利用して精度を高めるアテンション機構を提案する。
また,熱マップ上の各画素の重み付けを行う熱マップ重み付け損失(Heatmap weighting loss)と呼ばれる新たな損失関数を提案する。
- 参考スコア(独自算出の注目度): 7.830376406370752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research on human pose estimation exploits complex structures to
improve performance on benchmark datasets, ignoring the resource overhead and
inference speed when the model is actually deployed. In this paper, we lighten
the computation cost and parameters of the deconvolution head network in
SimpleBaseline and introduce an attention mechanism that utilizes original,
inter-level, and intra-level information to intensify the accuracy.
Additionally, we propose a novel loss function called heatmap weighting loss,
which generates weights for each pixel on the heatmap that makes the model more
focused on keypoints. Experiments demonstrate our method achieves a balance
between performance, resource volume, and inference speed. Specifically, our
method can achieve 65.3 AP score on COCO test-dev, while the inference speed is
55 FPS and 18 FPS on the mobile GPU and CPU, respectively.
- Abstract(参考訳): 人間のポーズ推定に関する最近の研究は、複雑な構造を利用してベンチマークデータセットのパフォーマンスを改善し、実際にモデルがデプロイされたときのリソースオーバーヘッドと推論速度を無視している。
本稿では,simplebaselineにおけるデコンボリューションヘッドネットワークの計算コストとパラメータを軽量化し,オリジナル情報,レベル間情報,レベル内情報を用いて精度を高める注意機構を提案する。
さらに,ヒートマップ上の各画素の重み付けを生成するヒートマップ重み付け損失と呼ばれる新しい損失関数を提案する。
実験により,本手法は性能,資源容積,推論速度のバランスがとれることを示した。
具体的には,COCOテストデブでは65.3のAPスコアが得られ,推定速度はモバイルGPUでは55FPS,CPUでは18FPSである。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Lightweight Super-Resolution Head for Human Pose Estimation [42.51588635059534]
ヒートマップに基づく手法がポーズ推定の主流となっている。
しかし、ヒートマップに基づくアプローチは、ダウンスケールのヒートマップを持つ重要な量子化誤差に悩まされる。
本稿では,SRPoseによる量子化誤差の低減と処理後処理への依存性について述べる。
論文 参考訳(メタデータ) (2023-07-31T15:35:34Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - Memory-Efficient Graph Convolutional Networks for Object Classification
and Detection with Event Cameras [2.3311605203774395]
グラフ畳み込みネットワーク(GCN)は、イベントデータを解析するための有望なアプローチである。
本稿では,満足度の高い結果と比較的低いモデル複雑性を達成するために,両要因を共に検討する。
その結果,特徴抽出モジュールのパラメータ数を450倍に減らし,データ表現のサイズを4.5倍に減らした。
論文 参考訳(メタデータ) (2023-07-26T11:44:44Z) - ALIKE: Accurate and Lightweight Keypoint Detection and Descriptor
Extraction [21.994171434960734]
本稿では,高精度なサブピクセルキーポイントを出力する可変キーポイント検出モジュールを提案する。
次に、これらのサブピクセルキーポイントを直接最適化するために再投影損失を提案し、分散ピーク損失を正確なキーポイント正規化のために提示する。
軽量ネットワークはキーポイント検出とディスクリプタ抽出のために設計されており、商用GPU上で640x480の画像に対して毎秒95フレームで動作する。
論文 参考訳(メタデータ) (2021-12-06T10:10:30Z) - Rethinking Keypoint Representations: Modeling Keypoints and Poses as
Objects for Multi-Person Human Pose Estimation [79.78017059539526]
本研究では,個々のキーポイントと空間的関連キーポイント(ポーズ)の集合を,密集した単一ステージアンカーベース検出フレームワーク内のオブジェクトとしてモデル化する,新しいヒートマップフリーなキーポイント推定手法を提案する。
実験では, KAPAOは従来手法よりもはるかに高速かつ高精度であり, 熱マップ後処理に悩まされていた。
我々の大規模モデルであるKAPAO-Lは、テスト時間拡張なしでMicrosoft COCO Keypoints検証セット上で70.6のAPを達成する。
論文 参考訳(メタデータ) (2021-11-16T15:36:44Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z) - Compression of descriptor models for mobile applications [26.498907514590165]
深層ニューラルネットワークにおける計算コスト,モデルサイズ,マッチング精度のトレードオフを評価する。
我々は、深度的に分離可能な層を用いることで、学習重量の顕著な冗長性を観察する。
本稿では,標準的な畳み込みと奥行き分離可能な畳み込みを補間する手段を提供する,畳み込み-Depthwise-Pointwise(CDP)層を提案する。
論文 参考訳(メタデータ) (2020-01-09T17:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。