論文の概要: A Self-supervised Pressure Map human keypoint Detection Approch:
Optimizing Generalization and Computational Efficiency Across Datasets
- arxiv url: http://arxiv.org/abs/2402.14241v1
- Date: Thu, 22 Feb 2024 02:54:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-23 16:45:27.183479
- Title: A Self-supervised Pressure Map human keypoint Detection Approch:
Optimizing Generalization and Computational Efficiency Across Datasets
- Title(参考訳): 自己教師付き圧力マップによる人間のキーポイント検出:データセット間の一般化と計算効率の最適化
- Authors: Chengzhang Yu and Xianjun Yang and Wenxia Bao and Shaonan Wang and
Zhiming Yao
- Abstract要約: 本研究では,SPMKD(Self-supervised pressure map keypoint detection)法を提案する。
我々の貢献の中心は、人間のキーポイントを正確に検出するための勾配エンコーダ、効率的な伝播のためのファーザ、人間のキーポイントを再構成された圧力マップに変換するデコーダを統合する軽量Fuser-Decoder(EFD)モデルである。
- 参考スコア(独自算出の注目度): 13.197904114784967
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In environments where RGB images are inadequate, pressure maps is a viable
alternative, garnering scholarly attention. This study introduces a novel
self-supervised pressure map keypoint detection (SPMKD) method, addressing the
current gap in specialized designs for human keypoint extraction from pressure
maps. Central to our contribution is the Encoder-Fuser-Decoder (EFD) model,
which is a robust framework that integrates a lightweight encoder for precise
human keypoint detection, a fuser for efficient gradient propagation, and a
decoder that transforms human keypoints into reconstructed pressure maps. This
structure is further enhanced by the Classification-to-Regression Weight
Transfer (CRWT) method, which fine-tunes accuracy through initial
classification task training. This innovation not only enhances human keypoint
generalization without manual annotations but also showcases remarkable
efficiency and generalization, evidenced by a reduction to only $5.96\%$ in
FLOPs and $1.11\%$ in parameter count compared to the baseline methods.
- Abstract(参考訳): RGB画像が不十分な環境では、圧力マップは有効な代替手段であり、学術的な注目を集めている。
本研究では,新しい自己教師付圧力マップキーポイント検出法(spmkd)を提案する。
これは、人間のキーポイントを正確に検出するための軽量エンコーダ、効率的な勾配伝播のためのfuser、人間のキーポイントを再構成された圧力マップに変換するデコーダを統合する堅牢なフレームワークです。
この構造は、初期分類タスクトレーニングによって微調整精度を向上するCRWT法によりさらに強化される。
この革新は人的キーポイントの一般化を手作業によるアノテーションなしで強化するだけでなく、効率と一般化が著しく向上し、フロップでは5.96\%、ベースライン法と比較してパラメータ数で1.11\%に減少することが証明された。
関連論文リスト
- Demystifying Catastrophic Forgetting in Two-Stage Incremental Object Detector [42.40881712297689]
破滅的な忘れ物は主にRoIヘッドに局在している。
NSGP-RePREは2種類のプロトタイプのリプレイを通じて忘れを緩和する。
NSGP-RePREはPascal VOCおよびMS COCOデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-08T12:10:02Z) - Predicting Transonic Flowfields in Non-Homogeneous Unstructured Grids Using Autoencoder Graph Convolutional Networks [0.0]
本稿では,計算流体力学(CFD)においてよく用いられる非均一非構造格子による問題に対処することに焦点を当てる。
我々のアプローチの核となるのは幾何学的深層学習、特にグラフ畳み込みネットワーク(GCN)の利用である。
新規なAutoencoder GCNアーキテクチャは、情報を遠隔ノードに伝播し、影響力のある点を強調することにより、予測精度を向上させる。
論文 参考訳(メタデータ) (2024-05-07T15:18:21Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - Fundamental Limits of Two-layer Autoencoders, and Achieving Them with
Gradient Methods [91.54785981649228]
本稿では,非線形二層型オートエンコーダについて述べる。
本結果は,人口リスクの最小化要因を特徴付け,その最小化要因が勾配法によって達成されることを示す。
符号アクティベーション関数の特別な場合において、この解析は、シャローオートエンコーダによるガウス音源の損失圧縮の基本的な限界を確立する。
論文 参考訳(メタデータ) (2022-12-27T12:37:34Z) - 2D Human Pose Estimation with Explicit Anatomical Keypoints Structure
Constraints [15.124606575017621]
本稿では,解剖学的キーポイント構造制約を明示した新しい2次元ポーズ推定手法を提案する。
提案手法は,既存のボトムアップやトップダウンの人間のポーズ推定手法に組み込むことができる。
提案手法は,既存のボトムアップとトップダウンの人間のポーズ推定手法に対して良好に機能する。
論文 参考訳(メタデータ) (2022-12-05T11:01:43Z) - BTranspose: Bottleneck Transformers for Human Pose Estimation with
Self-Supervised Pre-Training [0.304585143845864]
本稿では,CNNとマルチヘッド自己注意層(MHSA)を効果的に組み合わせたBottleneck Transformersを提案する。
我々は,異なるバックボーンアーキテクチャを考察し,DINO自己教師型学習手法を用いて事前学習を行う。
実験により,本モデルが [1] などの他の手法と競合する 76.4 のAPを達成でき,ネットワークパラメータも少ないことがわかった。
論文 参考訳(メタデータ) (2022-04-21T15:45:05Z) - Learning Local-Global Contextual Adaptation for Fully End-to-End
Bottom-Up Human Pose Estimation [37.63466061201821]
本稿では,完全エンドツーエンドかつ高速なボトムアップ人間のポーズ推定のための局所GlObal Contextual Adaptationの学習方法を提案する。
これは、ポーズ推定の不正確さに欠ける概念的に単純な中心オフセットの定式化に基づいている。
COCOのトレーニングモデルでは、私たちのLOGO-CAPは、挑戦的なOCHumanデータセットに対して大きなマージンで、先行技術よりも優れています。
論文 参考訳(メタデータ) (2021-09-08T13:15:01Z) - Accurate Grid Keypoint Learning for Efficient Video Prediction [87.71109421608232]
キーポイントベースのビデオ予測手法は、トレーニングやデプロイメントにおいて、かなりの計算資源を消費することができる。
本稿では,長期的効率的な映像予測のための頑健で説明可能な中間キーポイント表現を目的とした,新しいグリッドキーポイント学習フレームワークを設計する。
提案手法は,計算資源の98%以上を節約しつつ,最先端のビデオ予測手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-28T05:04:30Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。