論文の概要: Pose Recognition with Cascade Transformers
- arxiv url: http://arxiv.org/abs/2104.06976v1
- Date: Wed, 14 Apr 2021 17:00:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-15 13:14:13.208750
- Title: Pose Recognition with Cascade Transformers
- Title(参考訳): カスケードトランスフォーマによるポーズ認識
- Authors: Ke Li, Shijie Wang, Xiang Zhang, Yifan Xu, Weijian Xu, Zhuowen Tu
- Abstract要約: 変換器を用いた回帰型ポーズ認識手法を提案する。
ヒートマップベースおよび回帰ベースの手法は高い精度を達成するが、様々な設計の対象となる。
実験では, 競合回帰法と比較して, ポーズ認識の競合結果を報告する。
- 参考スコア(独自算出の注目度): 31.7059023190426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a regression-based pose recognition method using
cascade Transformers. One way to categorize the existing approaches in this
domain is to separate them into 1). heatmap-based and 2). regression-based. In
general, heatmap-based methods achieve higher accuracy but are subject to
various heuristic designs (not end-to-end mostly), whereas regression-based
approaches attain relatively lower accuracy but they have less intermediate
non-differentiable steps. Here we utilize the encoder-decoder structure in
Transformers to perform regression-based person and keypoint detection that is
general-purpose and requires less heuristic design compared with the existing
approaches. We demonstrate the keypoint hypothesis (query) refinement process
across different self-attention layers to reveal the recursive self-attention
mechanism in Transformers. In the experiments, we report competitive results
for pose recognition when compared with the competing regression-based methods.
- Abstract(参考訳): 本稿では,カスケードトランスを用いた回帰型ポーズ認識手法を提案する。
このドメインの既存のアプローチを分類する1つの方法は、それらを1)に分けることです。
Heatmap-based と 2)
回帰ベース。
一般に、熱マップに基づく手法は高い精度を達成できるが、様々なヒューリスティックな設計(主にエンドツーエンドではない)の対象となっている。
本稿では,トランスフォーマのエンコーダ・デコーダ構造を用いて,回帰に基づく人物検出とキーポイント検出を行う。
変換器における再帰的自己注意機構を明らかにするために,異なる自己注意層にまたがるキーポイント仮説(クエリ)改善過程を示す。
実験では, 姿勢認識において, 競合する回帰法と比較した場合の競合結果について報告する。
関連論文リスト
- Can Looped Transformers Learn to Implement Multi-step Gradient Descent for In-context Learning? [69.4145579827826]
収束ランドスケープの勾配非性アルゴリズムにもかかわらず、回帰損失に高速な流れを示す。
この設定における多層トランスの理論的解析はこれが初めてである。
論文 参考訳(メタデータ) (2024-10-10T18:29:05Z) - Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysis [63.66763657191476]
低ランク計算としての効率的な数値学習と推論アルゴリズムはトランスフォーマーに基づく適応学習に優れた性能を持つことを示す。
我々は、等級モデルが適応性を改善しながら一般化にどのように影響するかを分析する。
適切なマグニチュードベースのテストは,テストパフォーマンスに多少依存している,と結論付けています。
論文 参考訳(メタデータ) (2024-06-24T23:00:58Z) - How to get the most out of Twinned Regression Methods [0.0]
双対回帰法は、元の回帰問題の双対問題を解くために設計されている。
未知のデータポイントのターゲットと既知の複数のアンカーデータポイントとの予測差をアンカーに組み込むことで、元の回帰問題の解を得ることができる。
論文 参考訳(メタデータ) (2023-01-03T22:37:44Z) - Transformers learn in-context by gradient descent [58.24152335931036]
自己回帰目標におけるトランスフォーマーの訓練は、勾配に基づくメタラーニングの定式化と密接に関連している。
トレーニングされたトランスフォーマーがメザ最適化器となる方法,すなわち,前方通過における勾配降下によるモデル学習方法を示す。
論文 参考訳(メタデータ) (2022-12-15T09:21:21Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - TFPose: Direct Human Pose Estimation with Transformers [83.03424247905869]
ポーズ推定タスクを変換器で効果的に解くことができるシーケンス予測問題に定式化します。
我々のフレームワークは単純で直接的であり、ヒートマップに基づくポーズ推定の欠点を回避している。
MS-COCOおよびMPIIデータセットの実験は、この手法が回帰ベースのポーズ推定の最先端を大幅に改善できることを示しています。
論文 参考訳(メタデータ) (2021-03-29T04:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。