論文の概要: Continuous sign language recognition from wearable IMUs using deep
capsule networks and game theory
- arxiv url: http://arxiv.org/abs/2005.00409v1
- Date: Mon, 27 Apr 2020 01:21:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:05:26.175750
- Title: Continuous sign language recognition from wearable IMUs using deep
capsule networks and game theory
- Title(参考訳): ディープカプセルネットワークとゲーム理論を用いたウェアラブルIMUからの連続手話認識
- Authors: Karush Suri, Rinki Gupta
- Abstract要約: 本稿では,インド手話認識のための新しい1次元深層カプセルネットワーク(CapsNet)を提案する。
提案したCapsNetでは、3つのルーティングで94%、5つのルーティングで92.50%の精度が向上し、畳み込みニューラルネットワーク(CNN)では87.99%の精度が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sign Language is used by the deaf community all over world. The work
presented here proposes a novel one-dimensional deep capsule network (CapsNet)
architecture for continuous Indian Sign Language recognition by means of
signals obtained from a custom designed wearable IMU system. The performance of
the proposed CapsNet architecture is assessed by altering dynamic routing
between capsule layers. The proposed CapsNet yields improved accuracy values of
94% for 3 routings and 92.50% for 5 routings in comparison with the
convolutional neural network (CNN) that yields an accuracy of 87.99%. Improved
learning of the proposed architecture is also validated by spatial activations
depicting excited units at the predictive layer. Finally, a novel
non-cooperative pick-and-predict competition is designed between CapsNet and
CNN. Higher value of Nash equilibrium for CapsNet as compared to CNN indicates
the suitability of the proposed approach.
- Abstract(参考訳): 手話は世界中の聴覚障害のコミュニティで使われている。
本稿では,インド手話認識のための1次元深層カプセルネットワーク(CapsNet)アーキテクチャを提案する。
提案するCapsNetアーキテクチャの性能は,カプセル層間の動的ルーティングを変更することで評価する。
提案したCapsNetでは、3つのルーティングで94%、5つのルーティングで92.50%の精度が向上し、畳み込みニューラルネットワーク(CNN)では87.99%の精度が得られた。
また, 予測層における励起単位の空間的活性化により, 提案アーキテクチャの学習性の向上が検証された。
最後に、CapsNetとCNNの間に新しい非協調的なピック・アンド・予測コンペティションが設計されている。
CNNと比較して、CapsNetのNash平衡値が高いことは、提案手法の適合性を示している。
関連論文リスト
- Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - RobCaps: Evaluating the Robustness of Capsule Networks against Affine
Transformations and Adversarial Attacks [11.302789770501303]
Capsule Networks(CapsNets)は、画像分類タスクのための複数のオブジェクト間のポーズ関係を階層的に保存することができる。
本稿では、従来のコナールニューラルネットワーク(CNN)と比較して、CapsNetsの堅牢性に影響を与えるさまざまな要因を評価する。
論文 参考訳(メタデータ) (2023-04-08T09:58:35Z) - MogaNet: Multi-order Gated Aggregation Network [64.16774341908365]
我々は,識別的視覚的表現学習のために,MogaNetと呼ばれる現代ConvNetの新たなファミリーを提案する。
MogaNetは概念的に単純だが効果的な畳み込みをカプセル化し、集約をコンパクトモジュールに集約する。
MogaNetは、ImageNetの最先端のViTやConvNetと比較して、優れたスケーラビリティ、パラメータの大幅な効率、競争性能を示している。
論文 参考訳(メタデータ) (2022-11-07T04:31:17Z) - Novel Dual-Channel Long Short-Term Memory Compressed Capsule Networks
for Emotion Recognition [1.1799563040751588]
本研究では,テキストに依存しない,話者に依存しない新しいSERアーキテクチャを提案する。
CapsNetの構造的特徴に基づいて,2チャネル長短期メモリ圧縮CapsNetアルゴリズムを提案する。
4つのデータセットとMFCCのデルタデルタを使って、DC-LSTM COMP-CapsNetは最先端のシステムをすべて超越している。
論文 参考訳(メタデータ) (2021-12-26T10:37:35Z) - Interpretable Graph Capsule Networks for Object Recognition [17.62514568986647]
我々は,グラフカプセルネットワーク(GraCapsNets)を解釈可能とし,ルーティング部分をマルチヘッドアテンションベースのグラフポーリングアプローチで置き換える。
GraCapsNetsは、CapsNetsと比較して、より少ないパラメータとより良い逆の堅牢性で、より良い分類性能を達成する。
論文 参考訳(メタデータ) (2020-12-03T03:18:00Z) - FlowCaps: Optical Flow Estimation with Capsule Networks For Action
Recognition [22.712379018181398]
Capsule Networks(CapsNets)は最近、ほとんどのコンピュータビジョンタスクに優れたことを約束している。
本稿では,CapsNetをベースとしたFlowCapsアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-08T11:35:08Z) - Progressive Tandem Learning for Pattern Recognition with Deep Spiking
Neural Networks [80.15411508088522]
スパイキングニューラルネットワーク(SNN)は、低レイテンシと高い計算効率のために、従来の人工知能ニューラルネットワーク(ANN)よりも優位性を示している。
高速かつ効率的なパターン認識のための新しいANN-to-SNN変換およびレイヤワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-02T15:38:44Z) - iCapsNets: Towards Interpretable Capsule Networks for Text
Classification [95.31786902390438]
従来の機械学習手法は容易に解釈できるが、精度は低い。
このギャップを埋めるために、解釈可能なカプセルネットワーク(iCapsNets)を提案する。
iCapsNetsは、ローカルとグローバルの両方で解釈できる。
論文 参考訳(メタデータ) (2020-05-16T04:11:44Z) - Convolutional Neural Network Array for Sign Language Recognition using
Wearable IMUs [0.0]
本研究は,インド手話からの記号認識のための一次元畳み込みニューラルネットワーク(CNN)アレイアーキテクチャを提案する。
IMU装置を用いて記録された信号は、一般文や疑問文の署名に対応するかどうかなどの文脈に基づいて分離される。
論文 参考訳(メタデータ) (2020-04-21T23:11:04Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z) - ReActNet: Towards Precise Binary Neural Network with Generalized
Activation Functions [76.05981545084738]
本稿では,新たな計算コストを伴わずに,実数値ネットワークからの精度ギャップを埋めるため,バイナリネットワークを強化するためのいくつかのアイデアを提案する。
まず,パラメータフリーのショートカットを用いて,コンパクトな実数値ネットワークを修正・バイナライズすることで,ベースラインネットワークを構築する。
提案したReActNetはすべての最先端技術よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2020-03-07T02:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。