論文の概要: Dite-HRNet: Dynamic Lightweight High-Resolution Network for Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2204.10762v1
- Date: Fri, 22 Apr 2022 15:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 15:51:56.143952
- Title: Dite-HRNet: Dynamic Lightweight High-Resolution Network for Human Pose
Estimation
- Title(参考訳): Dite-HRNet:人間の姿勢推定のための動的軽量高分解能ネットワーク
- Authors: Qun Li, Ziyi Zhang, Fu Xiao, Feng Zhang and Bir Bhanu
- Abstract要約: 高解像度ネットワークは、人間のポーズ推定のためのマルチスケールの特徴を抽出する際、顕著な能力を示すが、関節間の長距離の相互作用を捉えることができない。
マルチスケールコンテキスト情報を効率的に抽出し,長距離空間依存性をモデル化する動的軽量高分解能ネットワーク(Dite-HRNet)を提案する。
- 参考スコア(独自算出の注目度): 39.780716241771785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A high-resolution network exhibits remarkable capability in extracting
multi-scale features for human pose estimation, but fails to capture long-range
interactions between joints and has high computational complexity. To address
these problems, we present a Dynamic lightweight High-Resolution Network
(Dite-HRNet), which can efficiently extract multi-scale contextual information
and model long-range spatial dependency for human pose estimation.
Specifically, we propose two methods, dynamic split convolution and adaptive
context modeling, and embed them into two novel lightweight blocks, which are
named dynamic multi-scale context block and dynamic global context block. These
two blocks, as the basic component units of our Dite-HRNet, are specially
designed for the high-resolution networks to make full use of the parallel
multi-resolution architecture. Experimental results show that the proposed
network achieves superior performance on both COCO and MPII human pose
estimation datasets, surpassing the state-of-the-art lightweight networks. Code
is available at: \url{https://github.com/ZiyiZhang27/Dite-HRNet}.
- Abstract(参考訳): 高分解能ネットワークは、人間のポーズ推定のためのマルチスケール特徴を抽出する際、顕著な能力を示すが、関節間の長距離相互作用を捉えられず、計算複雑性が高い。
これらの問題に対処するために,マルチスケールの文脈情報と,人間のポーズ推定のための長距離空間依存性をモデル化する動的軽量高解像度ネットワーク(Dite-HRNet)を提案する。
具体的には,動的分割畳み込みと適応コンテキストモデリングの2つの手法を提案し,それらを動的多スケールコンテキストブロックと動的グローバルコンテキストブロックという2つの新しい軽量ブロックに組み込む。
Dite-HRNetの基本構成単位であるこれらの2ブロックは、並列マルチ解像度アーキテクチャをフル活用する高解像度ネットワークのために特別に設計されている。
実験結果から,提案ネットワークはCOCOとMPIIの両方のポーズ推定データセットにおいて,最先端の軽量ネットワークよりも優れた性能を実現していることがわかった。
コードは \url{https://github.com/ziyizhang27/dite-hrnet} で入手できる。
関連論文リスト
- HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - BAFNet: Bilateral Attention Fusion Network for Lightweight Semantic Segmentation of Urban Remote Sensing Images [6.153725909241752]
本研究では,高分解能な都市リモートセンシング画像の分割を効率的に行うために,両側注意融合ネットワーク(BAFNet)と呼ばれる軽量なセマンティックセマンティックセマンティクスネットワークを提案する。
BAFNetは高度な軽量モデルを精度で上回るが、2つのデータセット上の非軽量な最先端メソッドに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-16T13:25:42Z) - MFPNet: Multi-scale Feature Propagation Network For Lightweight Semantic
Segmentation [5.58363644107113]
マルチスケール特徴伝達ネットワーク(Net)と呼ばれる,新しい軽量セグメンテーションアーキテクチャを提案する。
フレキシブル・ボトルネック・残差モジュール(BRM)からなる対称残差ブロックを有するロバスト・デコーダ構造を設計する。
遅延長範囲のコンテキスト関係をモデル化する能力の利点を生かして、グラフ畳み込みネットワーク(GCN)を活用し、BRMブロック間のマルチスケールフィーチャの伝搬を容易にする。
論文 参考訳(メタデータ) (2023-09-10T02:02:29Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - Learning Multi-Granular Spatio-Temporal Graph Network for Skeleton-based
Action Recognition [49.163326827954656]
骨格に基づく行動分類のための新しい多言語時空間グラフネットワークを提案する。
2つの枝の枝からなるデュアルヘッドグラフネットワークを開発し、少なくとも2つの時間分解能を抽出する。
3つの大規模データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-08-10T09:25:07Z) - MPRNet: Multi-Path Residual Network for Lightweight Image Super
Resolution [2.3576437999036473]
軽量SRにおけるSOTA性能を向上させる軽量超解像ネットワークを提案する。
提案アーキテクチャには新たなアテンション機構であるTwo-Fold Attention Moduleが含まれており,モデルの表現能力を最大化することができる。
論文 参考訳(メタデータ) (2020-11-09T17:11:15Z) - A Progressive Sub-Network Searching Framework for Dynamic Inference [33.93841415140311]
本稿では、トレーニング可能なノイズランキング、チャネルグループ、微調整しきい値設定、サブネット再選択など、いくつかの効果的な手法を組み込んだプログレッシブサブネット探索フレームワークを提案する。
提案手法は,従来普及していたUniversally-Slimmable-Networkの4.4%と平均2.3%と,モデルサイズが同じであるImageNetデータセットと比較して,より優れた動的推論精度を実現する。
論文 参考訳(メタデータ) (2020-09-11T22:56:02Z) - Recursive Multi-model Complementary Deep Fusion forRobust Salient Object
Detection via Parallel Sub Networks [62.26677215668959]
完全畳み込みネットワークは、正体検出(SOD)分野において優れた性能を示している。
本稿では,全く異なるネットワークアーキテクチャを持つ並列サブネットワークからなる,より広いネットワークアーキテクチャを提案する。
いくつかの有名なベンチマークの実験では、提案されたより広範なフレームワークの優れた性能、優れた一般化、強力な学習能力が明らかに示されている。
論文 参考訳(メタデータ) (2020-08-07T10:39:11Z) - OverNet: Lightweight Multi-Scale Super-Resolution with Overscaling
Network [3.6683231417848283]
SISRを任意のスケールで1つのモデルで解くための,深層でも軽量な畳み込みネットワークであるOverNetを紹介した。
我々のネットワークは、従来の手法よりも少ないパラメータを使用しながら、標準ベンチマークにおいて、過去の最先端結果よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-05T22:10:29Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。