論文の概要: Parallel Multi-Scale Networks with Deep Supervision for Hand Keypoint
Detection
- arxiv url: http://arxiv.org/abs/2112.10275v1
- Date: Sun, 19 Dec 2021 22:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 03:15:30.353704
- Title: Parallel Multi-Scale Networks with Deep Supervision for Hand Keypoint
Detection
- Title(参考訳): 手指キーポイント検出のための深い監視を伴う並列マルチスケールネットワーク
- Authors: Renjie Li, Son Tran, Saurabh Garg, Katherine Lawler, Jane Alty, Quan
Bai
- Abstract要約: マルチスケールディープスーパービジョンネットワーク(P-MSDSNet)という新しいCNNモデルを提案する。
P-MSDSNetは、層から層への適応的な特徴伝達のための注意マップを作成するために、深い監督の下で異なるスケールで特徴マップを学習する。
P-MSDSNetは,パラメータの少ないベンチマークデータセットにおいて,最先端の手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 3.1781111932870716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keypoint detection plays an important role in a wide range of applications.
However, predicting keypoints of small objects such as human hands is a
challenging problem. Recent works fuse feature maps of deep Convolutional
Neural Networks (CNNs), either via multi-level feature integration or
multi-resolution aggregation. Despite achieving some success, the feature
fusion approaches increase the complexity and the opacity of CNNs. To address
this issue, we propose a novel CNN model named Multi-Scale Deep Supervision
Network (P-MSDSNet) that learns feature maps at different scales with deep
supervisions to produce attention maps for adaptive feature propagation from
layers to layers. P-MSDSNet has a multi-stage architecture which makes it
scalable while its deep supervision with spatial attention improves
transparency to the feature learning at each stage. We show that P-MSDSNet
outperforms the state-of-the-art approaches on benchmark datasets while
requiring fewer number of parameters. We also show the application of P-MSDSNet
to quantify finger tapping hand movements in a neuroscience study.
- Abstract(参考訳): キーポイント検出は幅広いアプリケーションにおいて重要な役割を果たす。
しかし、人間の手のような小さな物体のキーポイントを予測することは難しい問題である。
深層畳み込みニューラルネットワーク(cnns)のヒューズ特徴マップは、マルチレベル特徴統合またはマルチレゾリューションアグリゲーションを介して作成されている。
ある程度の成功にもかかわらず、機能融合アプローチはcnnの複雑さと不透明性を高める。
この問題に対処するため,我々は,階層から層への適応的特徴伝達のための注目マップを作成するために,異なるスケールで特徴マップを深層監視により学習する,Multi-Scale Deep Supervision Network (P-MSDSNet) という新しいCNNモデルを提案する。
P-MSDSNetはマルチステージアーキテクチャを備えており、空間的注意による深い監視によって各ステージにおける特徴学習への透明性が向上する。
P-MSDSNetは,パラメータの少ないベンチマークデータセットにおいて,最先端の手法よりも優れていることを示す。
また,P-MSDSNetを用いた手の動きの定量化についても検討した。
関連論文リスト
- Multi-scale Unified Network for Image Classification [33.560003528712414]
CNNは、実世界のマルチスケール画像入力を扱う際に、性能と計算効率において顕著な課題に直面している。
本稿では,マルチスケール,統一ネットワーク,スケール不変制約からなるMultiscale Unified Network(MUSN)を提案する。
MUSNは精度が44.53%向上し、マルチスケールシナリオではFLOPを7.01-16.13%減少させる。
論文 参考訳(メタデータ) (2024-03-27T06:40:26Z) - Pyramid Feature Attention Network for Monocular Depth Prediction [8.615717738037823]
本稿では,高レベルな文脈特徴と低レベルな空間特徴を改善するために,ピラミッド特徴注意ネットワーク(PFANet)を提案する。
提案手法は,KITTIデータセット上での最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-03T08:33:23Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - Interflow: Aggregating Multi-layer Feature Mappings with Attention
Mechanism [0.7614628596146599]
本稿では,従来のCNNモデルに特化してInterflowアルゴリズムを提案する。
Interflowは、深さに応じてCNNを複数のステージに分割し、各ステージの特徴マッピングによって予測する。
勾配の消失問題を緩和し、ネットワーク深度選択の難しさを低減し、過度に適合できる問題を緩和することができる。
論文 参考訳(メタデータ) (2021-06-26T18:22:01Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Multi-Attention-Network for Semantic Segmentation of Fine Resolution
Remote Sensing Images [10.835342317692884]
リモートセンシング画像におけるセマンティックセグメンテーションの精度は、ディープ畳み込みニューラルネットワークによって著しく向上した。
本稿では,これらの問題に対処するマルチアテンション・ネットワーク(MANet)を提案する。
線形複雑性を伴うカーネル注意の新たなアテンション機構が提案され,注目される計算負荷の低減が図られた。
論文 参考訳(メタデータ) (2020-09-03T09:08:02Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。