Fugu-MT 論文翻訳(概要): Exploiting Learnable Joint Groups for Hand Pose Estimation

論文の概要: Exploiting Learnable Joint Groups for Hand Pose Estimation

arxiv url: http://arxiv.org/abs/2012.09496v1
Date: Thu, 17 Dec 2020 10:47:28 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-02 07:25:32.109837
Title: Exploiting Learnable Joint Groups for Hand Pose Estimation
Title（参考訳）: 学習可能な関節群を用いた手のポーズ推定
Authors: Moran Li, Yuan Gao, Nong Sang
Abstract要約: 関節の3次元座標をグループ的に復元し,3次元ハンドポーズの推定を提案する。これは、すべての関節が正に考慮され、同じ機能を共有する以前の方法とは異なります。我々は、Groupsd機能に複数の1x1畳み込みを実装し、各ジョイントグループは特徴融合のための1x1畳み込みを含む。
参考スコア（独自算出の注目度）: 26.418203566696587
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose to estimate 3D hand pose by recovering the 3D coordinates of joints in a group-wise manner, where less-related joints are automatically categorized into different groups and exhibit different features. This is different from the previous methods where all the joints are considered holistically and share the same feature. The benefits of our method are illustrated by the principle of multi-task learning (MTL), i.e., by separating less-related joints into different groups (as different tasks), our method learns different features for each of them, therefore efficiently avoids the negative transfer (among less related tasks/groups of joints). The key of our method is a novel binary selector that automatically selects related joints into the same group. We implement such a selector with binary values stochastically sampled from a Concrete distribution, which is constructed using Gumbel softmax on trainable parameters. This enables us to preserve the differentiable property of the whole network. We further exploit features from those less-related groups by carrying out an additional feature fusing scheme among them, to learn more discriminative features. This is realized by implementing multiple 1x1 convolutions on the concatenated features, where each joint group contains a unique 1x1 convolution for feature fusion. The detailed ablation analysis and the extensive experiments on several benchmark datasets demonstrate the promising performance of the proposed method over the state-of-the-art (SOTA) methods. Besides, our method achieves top-1 among all the methods that do not exploit the dense 3D shape labels on the most recently released FreiHAND competition at the submission date. The source code and models are available at https://github.com/ moranli-aca/LearnableGroups-Hand.
Abstract（参考訳）: 本稿では, 関節の3次元座標をグループ的に復元し, 低関係の関節が自動的に異なるグループに分類され, 異なる特徴を示す3次元ハンドポーズを推定する。これは、全てのジョイントが階層的に考慮され、同じ特徴を共有する以前の方法とは異なる。提案手法の利点はマルチタスク学習(MTL)の原理,すなわち,低関係の関節を異なるグループ(異なるタスク)に分けて各グループごとに異なる特徴を学習することにより,負の移動を効果的に回避する。提案手法の鍵となるのは, 関連継手を自動的に同一群に選択する新しいバイナリセレクタである。学習可能なパラメータにgumbel softmaxを用いて構築した,具体的分布から確率的にサンプリングされたバイナリ値を持つセレクタを実装した。これにより、ネットワーク全体の差別化可能な特性を保存できます。さらに,これらの非関連グループからの機能を活用し,それらの間の機能融合方式を適用し,より識別的な特徴を学習する。これは、結合した特徴に対して複数の1x1畳み込みを実装することで実現され、各結合群は特徴融合のための1x1畳み込みを含む。いくつかのベンチマークデータセットにおける詳細なアブレーション解析と広範な実験は、最先端(sota)法に対する提案手法の有望な性能を示している。また,提案手法は,最新のfreihandコンペティションにおいて,密集した3d形状ラベルを使用しないすべての手法の中でトップ1を達成した。ソースコードとモデルはhttps://github.com/moranli-aca/learnablegroups-handで入手できる。

関連論文リスト

Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-30T00:32:47Z)
ManiFeSt: Manifold-based Feature Selection for Small Data Sets [9.649457851261909]
少数サンプル教師付き特徴選択(FS)のための新しい手法を提案する。提案手法はまず,多機能アソシエーションをキャプチャするカーネルを用いて,各クラスの特徴空間の多様体を学習する。テストデータに適用した場合,FSにより分類が向上し,一般化が向上することを示す。
論文参考訳（メタデータ） (2022-07-18T12:58:01Z)
PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文参考訳（メタデータ） (2022-04-25T02:41:46Z)
OneRel:Joint Entity and Relation Extraction with One Module in One Step [42.576188878294886]
統合エンティティと関係抽出は自然言語処理と知識グラフ構築において不可欠な課題である。そこで我々は, 結合抽出を細粒度三重分類問題として用いた, OneRel という新しい結合実体と関係抽出モデルを提案する。
論文参考訳（メタデータ） (2022-03-10T15:09:59Z)
Model-free feature selection to facilitate automatic discovery of divergent subgroups in tabular data [4.551615447454768]
本稿では,分散サブグループの自動発見を容易にするために,モデルフリーかつスパーシティベース自動特徴選択(SAFS)フレームワークを提案する。 2つの公開データセット(MIMIC-IIIとAllstate Claims)でSAFSを検証し、既存の6つの特徴選択手法と比較した。
論文参考訳（メタデータ） (2022-03-08T20:42:56Z)
Gated recurrent units and temporal convolutional network for multilabel classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文参考訳（メタデータ） (2021-10-09T00:00:16Z)
Hybrid Multisource Feature Fusion for the Text Clustering [5.5586788751870175]
テキストクラスタリング技術は、大量のテキスト文書をグループに分割するために使用される教師なしのテキストマイニング手法である。本稿では,3つのコンポーネント,マルチモデルの特徴表現,相互類似度行列,特徴融合からなるハイブリッドマルチソース特徴融合(HMFF)フレームワークを提案する。私たちのHMFFフレームワークは、11の公開ベンチマークデータセットのうち7つで、最近発表された他のアルゴリズムよりも優れています。
論文参考訳（メタデータ） (2021-08-24T19:32:09Z)
Generative Multi-Label Zero-Shot Learning [136.17594611722285]
マルチラベルゼロショット学習は、トレーニング中にデータが入手できない複数の見えないカテゴリにイメージを分類する試みである。我々の研究は、(一般化された)ゼロショット設定におけるマルチラベル機能の問題に最初に取り組みました。私たちのクロスレベル核融合に基づく生成アプローチは、3つのデータセットすべてにおいて最先端の手法よりも優れています。
論文参考訳（メタデータ） (2021-01-27T18:56:46Z)
Towards Improved and Interpretable Deep Metric Learning via Attentive Grouping [103.71992720794421]
グループ化は、様々な特徴の計算にディープ・メトリック・ラーニングでよく用いられてきた。本稿では,任意のメトリクス学習フレームワークと柔軟に統合可能な,改良された解釈可能なグループ化手法を提案する。
論文参考訳（メタデータ） (2020-11-17T19:08:24Z)
Differentiable Hierarchical Graph Grouping for Multi-Person Pose Estimation [95.72606536493548]
複数の人の身体のキーポイントを同時にローカライズするため、複数の人物のポーズ推定は困難である。ボトムアップ型多人数ポーズ推定タスクにおけるグラフグループ化を学習するための,新しい微分可能な階層グラフグループ化(HGG)手法を提案する。
論文参考訳（メタデータ） (2020-07-23T08:46:22Z)
LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。 CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文参考訳（メタデータ） (2020-06-17T17:58:10Z)
Multi-Person Pose Estimation with Enhanced Feature Aggregation and Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2020-03-20T08:33:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。