論文の概要: Exploiting Learnable Joint Groups for Hand Pose Estimation
- arxiv url: http://arxiv.org/abs/2012.09496v1
- Date: Thu, 17 Dec 2020 10:47:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:25:32.109837
- Title: Exploiting Learnable Joint Groups for Hand Pose Estimation
- Title(参考訳): 学習可能な関節群を用いた手のポーズ推定
- Authors: Moran Li, Yuan Gao, Nong Sang
- Abstract要約: 関節の3次元座標をグループ的に復元し,3次元ハンドポーズの推定を提案する。
これは、すべての関節が正に考慮され、同じ機能を共有する以前の方法とは異なります。
我々は、Groupsd機能に複数の1x1畳み込みを実装し、各ジョイントグループは特徴融合のための1x1畳み込みを含む。
- 参考スコア(独自算出の注目度): 26.418203566696587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose to estimate 3D hand pose by recovering the 3D
coordinates of joints in a group-wise manner, where less-related joints are
automatically categorized into different groups and exhibit different features.
This is different from the previous methods where all the joints are considered
holistically and share the same feature. The benefits of our method are
illustrated by the principle of multi-task learning (MTL), i.e., by separating
less-related joints into different groups (as different tasks), our method
learns different features for each of them, therefore efficiently avoids the
negative transfer (among less related tasks/groups of joints). The key of our
method is a novel binary selector that automatically selects related joints
into the same group. We implement such a selector with binary values
stochastically sampled from a Concrete distribution, which is constructed using
Gumbel softmax on trainable parameters. This enables us to preserve the
differentiable property of the whole network. We further exploit features from
those less-related groups by carrying out an additional feature fusing scheme
among them, to learn more discriminative features. This is realized by
implementing multiple 1x1 convolutions on the concatenated features, where each
joint group contains a unique 1x1 convolution for feature fusion. The detailed
ablation analysis and the extensive experiments on several benchmark datasets
demonstrate the promising performance of the proposed method over the
state-of-the-art (SOTA) methods. Besides, our method achieves top-1 among all
the methods that do not exploit the dense 3D shape labels on the most recently
released FreiHAND competition at the submission date. The source code and
models are available at https://github.com/ moranli-aca/LearnableGroups-Hand.
- Abstract(参考訳): 本稿では, 関節の3次元座標をグループ的に復元し, 低関係の関節が自動的に異なるグループに分類され, 異なる特徴を示す3次元ハンドポーズを推定する。
これは、全てのジョイントが階層的に考慮され、同じ特徴を共有する以前の方法とは異なる。
提案手法の利点はマルチタスク学習(MTL)の原理,すなわち,低関係の関節を異なるグループ(異なるタスク)に分けて各グループごとに異なる特徴を学習することにより,負の移動を効果的に回避する。
提案手法の鍵となるのは, 関連継手を自動的に同一群に選択する新しいバイナリセレクタである。
学習可能なパラメータにgumbel softmaxを用いて構築した,具体的分布から確率的にサンプリングされたバイナリ値を持つセレクタを実装した。
これにより、ネットワーク全体の差別化可能な特性を保存できます。
さらに,これらの非関連グループからの機能を活用し,それらの間の機能融合方式を適用し,より識別的な特徴を学習する。
これは、結合した特徴に対して複数の1x1畳み込みを実装することで実現され、各結合群は特徴融合のための1x1畳み込みを含む。
いくつかのベンチマークデータセットにおける詳細なアブレーション解析と広範な実験は、最先端(sota)法に対する提案手法の有望な性能を示している。
また,提案手法は,最新のfreihandコンペティションにおいて,密集した3d形状ラベルを使用しないすべての手法の中でトップ1を達成した。
ソースコードとモデルはhttps://github.com/moranli-aca/learnablegroups-handで入手できる。
関連論文リスト
- Decoupling Predictions in Distributed Learning for Multi-Center Left
Atrial MRI Segmentation [20.20518948616193]
本稿では,2つのグループ間のギャップを埋める分散学習のフレームワークを提案する。
左房左房左房 (LA) MRI 区分けを行った結果, 総括的データと局所的データの両方において, 既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-06-10T08:35:42Z) - Robust Representation via Dynamic Feature Aggregation [44.927408735490005]
ディープ畳み込みニューラルネットワーク(CNN)ベースのモデルは、敵の攻撃に対して脆弱である。
本稿では,新しい正規化により埋め込み空間を圧縮する動的特徴集約法を提案する。
CIFAR-10における攻撃法の平均精度は56.91%である。
論文 参考訳(メタデータ) (2022-05-16T06:22:15Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - OneRel:Joint Entity and Relation Extraction with One Module in One Step [42.576188878294886]
統合エンティティと関係抽出は自然言語処理と知識グラフ構築において不可欠な課題である。
そこで我々は, 結合抽出を細粒度三重分類問題として用いた, OneRel という新しい結合実体と関係抽出モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T15:09:59Z) - Model-free feature selection to facilitate automatic discovery of
divergent subgroups in tabular data [4.551615447454768]
本稿では,分散サブグループの自動発見を容易にするために,モデルフリーかつスパーシティベース自動特徴選択(SAFS)フレームワークを提案する。
2つの公開データセット(MIMIC-IIIとAllstate Claims)でSAFSを検証し、既存の6つの特徴選択手法と比較した。
論文 参考訳(メタデータ) (2022-03-08T20:42:56Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Pack Together: Entity and Relation Extraction with Levitated Marker [61.232174424421025]
エンコーダにマーカを戦略的にパッケージ化することにより,スパン(ペア)間の依存関係を検討するために,Packed Levitated Markersという新しいスパン表現手法を提案する。
実験の結果,3つの平坦なNERタスクにおいて,有望なマーカーが充填されたモデルの方がシーケンスラベルモデルよりも0.4%-1.9%優れ,トークンコンキャットモデルを6つのNERベンチマークで上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-13T15:38:13Z) - Hybrid Multisource Feature Fusion for the Text Clustering [5.5586788751870175]
テキストクラスタリング技術は、大量のテキスト文書をグループに分割するために使用される教師なしのテキストマイニング手法である。
本稿では,3つのコンポーネント,マルチモデルの特徴表現,相互類似度行列,特徴融合からなるハイブリッドマルチソース特徴融合(HMFF)フレームワークを提案する。
私たちのHMFFフレームワークは、11の公開ベンチマークデータセットのうち7つで、最近発表された他のアルゴリズムよりも優れています。
論文 参考訳(メタデータ) (2021-08-24T19:32:09Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Generative Multi-Label Zero-Shot Learning [126.04772769084639]
マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。
我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。
私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-01-27T18:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。