論文の概要: SRNet: Improving Generalization in 3D Human Pose Estimation with a
Split-and-Recombine Approach
- arxiv url: http://arxiv.org/abs/2007.09389v1
- Date: Sat, 18 Jul 2020 10:02:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 05:42:18.927936
- Title: SRNet: Improving Generalization in 3D Human Pose Estimation with a
Split-and-Recombine Approach
- Title(参考訳): SRNet:スプリット・アンド・リコンビインアプローチによる3次元人文推定における一般化の改善
- Authors: Ailing Zeng, Xiao Sun, Fuyang Huang, Minhao Liu, Qiang Xu, Stephen Lin
- Abstract要約: 局所的なポーズ分布は、視覚認識における長い尾の問題に苦しむ。
本手法では,身体を局所的に分割し,別々のネットワークブランチで処理する。
SRNetと呼ばれる提案された分割組換えアプローチは、単一画像モデルと時間モデルの両方に容易に適応できる。
- 参考スコア(独自算出の注目度): 40.76785688422364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human poses that are rare or unseen in a training set are challenging for a
network to predict. Similar to the long-tailed distribution problem in visual
recognition, the small number of examples for such poses limits the ability of
networks to model them. Interestingly, local pose distributions suffer less
from the long-tail problem, i.e., local joint configurations within a rare pose
may appear within other poses in the training set, making them less rare. We
propose to take advantage of this fact for better generalization to rare and
unseen poses. To be specific, our method splits the body into local regions and
processes them in separate network branches, utilizing the property that a
joint position depends mainly on the joints within its local body region.
Global coherence is maintained by recombining the global context from the rest
of the body into each branch as a low-dimensional vector. With the reduced
dimensionality of less relevant body areas, the training set distribution
within network branches more closely reflects the statistics of local poses
instead of global body poses, without sacrificing information important for
joint inference. The proposed split-and-recombine approach, called SRNet, can
be easily adapted to both single-image and temporal models, and it leads to
appreciable improvements in the prediction of rare and unseen poses.
- Abstract(参考訳): トレーニングセットで珍しい、あるいは目に見えない人間のポーズは、ネットワークが予測するのは難しい。
視覚認識における長い尾の分布問題と同様、少数の例ではネットワークがそれらをモデル化する能力に制限がある。
興味深いことに、局所的なポーズ分布は、長い尾の問題、すなわち、稀なポーズ内の局所的な関節構成がトレーニングセット内の他のポーズに出現し、希少でない。
我々はこの事実を利用して、稀で目に見えないポーズへのより良い一般化を提案する。
具体的には, 身体を局所領域に分割し, 個別のネットワーク枝で処理し, 関節位置が主に局所領域内の関節に依存する特性を生かした。
グローバルコヒーレンスは、体の他の部分から各枝に低次元ベクトルとしてグローバルコンテキストを再結合することによって維持される。
関係の少ない身体領域の次元が減少するにつれて、ネットワークブランチ内のトレーニングセット分布は、共同推論に重要な情報を犠牲にすることなく、グローバルな身体ポーズの代わりに局所的なポーズの統計をより深く反映する。
SRNetと呼ばれる提案された分割組換えアプローチは、単一画像と時間モデルの両方に容易に適用でき、稀で見えないポーズの予測において良好な改善をもたらす。
関連論文リスト
- A Dual-Augmentor Framework for Domain Generalization in 3D Human Pose Estimation [11.525573321175925]
制御された実験室で収集された3D人間のポーズデータは、様々なシナリオにまたがって一般化されたポーズ推定装置の課題を示す。
本稿では,2つのポーズオーグメンタ,すなわち弱いポーズオーグメンタと強いオーグメンタを特徴とする新しいフレームワークを提案する。
提案手法は,様々なベンチマークデータセットの総合的な実験により,既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-17T19:10:07Z) - Reconstructing Groups of People with Hypergraph Relational Reasoning [22.440625156246494]
単眼画像から集団を再構築するために,群集の特徴を利用する。
複素および高次相関関係を定式化するために,新しいハイパーグラフリレーショナル推論ネットワークを提案する。
このアプローチは、混み合ったシナリオと一般的なシナリオの両方において、他のベースラインメソッドよりも優れています。
論文 参考訳(メタデータ) (2023-08-30T08:31:55Z) - PoseTrans: A Simple Yet Effective Pose Transformation Augmentation for
Human Pose Estimation [40.50255017107963]
我々は多彩なポーズを持つ新しいトレーニングサンプルを作成するために、Pose Transformation (PoseTrans)を提案する。
また,ポーズの規則性を測定するためにPose Clustering Module (PCM)を提案する。
提案手法は効率的で実装が容易であり,既存のポーズ推定モデルのトレーニングパイプラインに容易に組み込むことができる。
論文 参考訳(メタデータ) (2022-08-16T14:03:01Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Federated Learning from Small Datasets [48.879172201462445]
フェデレーション学習は、複数のパーティが、ローカルデータを共有せずに、共同モデルを共同でトレーニングすることを可能にする。
そこで本研究では,局所モデルの置換とモデルアグリゲーションを連動させる新しい手法を提案する。
置換は、各ローカルモデルをローカルデータセットのデージーチェーンに公開することで、データスパースドメインでのより効率的なトレーニングを実現する。
論文 参考訳(メタデータ) (2021-10-07T13:49:23Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Monocular 3D Multi-Person Pose Estimation by Integrating Top-Down and
Bottom-Up Networks [33.974241749058585]
マルチパーソンポーズ推定は、人間の検出が間違っている可能性があり、人間の結合群は信頼できない。
既存のトップダウン手法は人間の検出に依存しているため、これらの問題に悩まされる。
我々は,その強みを生かすために,トップダウンアプローチとボトムアップアプローチの統合を提案する。
論文 参考訳(メタデータ) (2021-04-05T07:05:21Z) - Chasing the Tail in Monocular 3D Human Reconstruction with Prototype
Memory [98.36233875637168]
本稿では,レアポーズの予測性能を効果的に向上するメモリ拡張ネットワークPM-Netを提案する。
本研究では,1)この学習障害を特定し解析し,2)稀なポーズの予測性能を効果的に向上するメモリ拡張ネットワークPM-Netを提案する。
論文 参考訳(メタデータ) (2020-12-29T12:57:22Z) - PoP-Net: Pose over Parts Network for Multi-Person 3D Pose Estimation
from a Depth Image [23.4306183645569]
PoP-Netは、ボトムアップ部分検出マップとトップダウングローバルポーズを単発フレームワークで予測することを学ぶ。
Truncated Part Displacement Field (TPDF)と呼ばれる新しい部分レベルの表現が導入される。
グローバルポーズと局所検出の競合を自動的に解消するモード選択スキームを開発した。
論文 参考訳(メタデータ) (2020-12-12T05:32:25Z) - Global Distance-distributions Separation for Unsupervised Person
Re-identification [93.39253443415392]
既存の教師なしのReIDアプローチは、距離ベースのマッチング/ランク付けを通じて正のサンプルと負のサンプルを正しく識別するのに失敗することが多い。
本研究では,2つの分布に対する大域的距離分布分離の制約を導入し,大域的視点から正と負のサンプルを明確に分離することを奨励する。
本研究では,本手法がベースラインを大幅に改善し,最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2020-06-01T07:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。