論文の概要: Capsules as viewpoint learners for human pose estimation
- arxiv url: http://arxiv.org/abs/2302.06194v1
- Date: Mon, 13 Feb 2023 09:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 16:16:36.266579
- Title: Capsules as viewpoint learners for human pose estimation
- Title(参考訳): 人間ポーズ推定のための視点学習者としてのカプセル
- Authors: Nicola Garau, Nicola Conci
- Abstract要約: カメラが大きな視点変化を受けると、ほとんどのニューラルネットワークがうまく一般化できないことを示す。
本稿では,高速な変分ベイズルーティングとマトリックスカプセルを用いた,エンドツーエンドのポジショニング等価なカプセルオートエンコーダを提案する。
複数のタスクやデータセットに対して、他の望ましい特性を維持しながら、最先端の結果を得る。
- 参考スコア(独自算出の注目度): 4.246061945756033
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of human pose estimation (HPE) deals with the ill-posed problem of
estimating the 3D position of human joints directly from images and videos. In
recent literature, most of the works tackle the problem mostly by using
convolutional neural networks (CNNs), which are capable of achieving
state-of-the-art results in most datasets. We show how most neural networks are
not able to generalize well when the camera is subject to significant viewpoint
changes. This behaviour emerges because CNNs lack the capability of modelling
viewpoint equivariance, while they rather rely on viewpoint invariance,
resulting in high data dependency. Recently, capsule networks (CapsNets) have
been proposed in the multi-class classification field as a solution to the
viewpoint equivariance issue, reducing both the size and complexity of both the
training datasets and the network itself. In this work, we show how capsule
networks can be adopted to achieve viewpoint equivariance in human pose
estimation. We propose a novel end-to-end viewpoint-equivariant capsule
autoencoder that employs a fast Variational Bayes routing and matrix capsules.
We achieve state-of-the-art results for multiple tasks and datasets while
retaining other desirable properties, such as greater generalization
capabilities when changing viewpoints, lower data dependency and fast
inference. Additionally, by modelling each joint as a capsule, the hierarchical
and geometrical structure of the overall pose is retained in the feature space,
independently from the viewpoint. We further test our network on multiple
datasets, both in the RGB and depth domain, from seen and unseen viewpoints and
in the viewpoint transfer task.
- Abstract(参考訳): human pose estimation(hpe)のタスクは、画像やビデオから直接、人間の関節の3d位置を推定するという不適切な問題を扱う。
近年の文献では、ほとんどの著作が、ほとんどのデータセットで最先端の結果が得られる畳み込みニューラルネットワーク(cnns)を用いてこの問題に取り組んでいる。
カメラが重要な視点変化を受けると、ほとんどのニューラルネットワークがうまく一般化できないことを示す。
この振舞いは、CNNが視点不変性をモデル化する能力に欠けており、むしろ視点不変性に依存しており、結果としてデータ依存度が高いことから生じる。
近年,多クラス分類分野のカプセルネットワーク(CapsNets)が,視点等分散問題の解法として提案され,トレーニングデータセットとネットワーク自体のサイズと複雑さの両面で低減されている。
本稿では,人間のポーズ推定における視点均等性を達成するためにカプセルネットワークをどのように適用できるかを示す。
本稿では,高速な変分ベイズルーティングとマトリックスカプセルを用いた,エンドツーエンドの視点等価カプセルオートエンコーダを提案する。
視点変更時の一般化機能の向上,データ依存性の低減,高速推論など,他の望ましい特性を維持しつつ,複数のタスクやデータセットの最先端結果を実現する。
さらに、各関節をカプセルとしてモデル化することにより、全体ポーズの階層構造と幾何学構造は、視点から独立して特徴空間に保持される。
さらに,rgb領域と深度領域の両方において,視認および視認不能な視点から,視点転送タスクにおいて,複数のデータセット上でネットワークをテストした。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Universal Representations: A Unified Look at Multiple Task and Domain
Learning [37.27708297562079]
本稿では,複数の視覚タスクと視覚領域を共通表現によって統合的に学習することを提案する。
複数の密接な予測問題の学習において、普遍表現が最先端のパフォーマンスを達成することを示す。
また、アブレーションと定性的な研究を通じて複数の分析を行う。
論文 参考訳(メタデータ) (2022-04-06T11:40:01Z) - Anomaly Detection using Capsule Networks for High-dimensional Datasets [0.0]
本研究では, カプセルネットワークを用いて異常検出を行う。
我々の知る限りでは、これはカプセルネットワークが高次元複素データ設定における異常検出タスクのために解析される最初の事例である。
論文 参考訳(メタデータ) (2021-12-27T05:07:02Z) - DECA: Deep viewpoint-Equivariant human pose estimation using Capsule
Autoencoders [3.2826250607043796]
トレーニング時に見つからない視点を扱う場合、現在の3Dヒューマンポース推定法は失敗する傾向にあることを示す。
そこで本研究では,高速変動ベイズカプセルルーティングを用いたカプセルオートエンコーダネットワークDECAを提案する。
実験による検証では,視界・視界・視界・視界・視界・視界の両面から,奥行き画像の他の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-19T08:46:15Z) - Deformable Capsules for Object Detection [3.702343116848637]
我々は,コンピュータビジョンにおいて重要な問題である物体検出に対処するために,新しいカプセルネットワーク,変形可能なカプセル(textitDeformCaps)を導入した。
提案手法は,本論文において,オブジェクト検出のためのカプセルネットワークを構築するために,効率よくスケールアップできることを実証する。
論文 参考訳(メタデータ) (2021-04-11T15:36:30Z) - Exploiting Invariance in Training Deep Neural Networks [4.169130102668252]
動物視覚システムの2つの基本的なメカニズムに触発され、ディープニューラルネットワークのトレーニングに不変性を与える特徴変換技術を紹介します。
結果として得られるアルゴリズムはパラメータチューニングを少なくし、初期学習率1.0でうまくトレーニングし、異なるタスクに簡単に一般化する。
ImageNet、MS COCO、Cityscapesデータセットでテストされた当社の提案手法は、トレーニングにより少ないイテレーションを必要とし、すべてのベースラインを大きなマージンで上回り、小規模および大規模のバッチサイズのトレーニングをシームレスに行い、画像分類、オブジェクト検出、セマンティックセグメンテーションの異なるコンピュータビジョンタスクに適用します。
論文 参考訳(メタデータ) (2021-03-30T19:18:31Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Subspace Capsule Network [85.69796543499021]
SubSpace Capsule Network (SCN) はカプセルネットワークのアイデアを利用して、エンティティの外観や暗黙的に定義された特性のバリエーションをモデル化する。
SCNは、テスト期間中にCNNと比較して計算オーバーヘッドを発生させることなく、識別モデルと生成モデルの両方に適用することができる。
論文 参考訳(メタデータ) (2020-02-07T17:51:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。