論文の概要: A Novel Hand Gesture Detection and Recognition system based on
ensemble-based Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2202.12519v1
- Date: Fri, 25 Feb 2022 06:46:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 21:24:35.367144
- Title: A Novel Hand Gesture Detection and Recognition system based on
ensemble-based Convolutional Neural Network
- Title(参考訳): アンサンブルに基づく畳み込みニューラルネットワークに基づく新しい手指検出・認識システム
- Authors: Abir Sen, Tapas Kumar Mishra, Ratnakar Dash
- Abstract要約: コンピュータビジョンとパターン認識コミュニティでは,手の部分検出が課題となっている。
畳み込みニューラルネットワーク(CNN)アーキテクチャのようなディープラーニングアルゴリズムは、分類タスクにおいて非常に一般的な選択肢となっている。
本稿では,CNNに基づくアプローチのアンサンブルを用いて,予測時の高分散や過度な問題,予測誤差などの問題を克服する。
- 参考スコア(独自算出の注目度): 3.5665681694253903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nowadays, hand gesture recognition has become an alternative for
human-machine interaction. It has covered a large area of applications like 3D
game technology, sign language interpreting, VR (virtual reality) environment,
and robotics. But detection of the hand portion has become a challenging task
in computer vision and pattern recognition communities. Deep learning algorithm
like convolutional neural network (CNN) architecture has become a very popular
choice for classification tasks, but CNN architectures suffer from some
problems like high variance during prediction, overfitting problem and also
prediction errors. To overcome these problems, an ensemble of CNN-based
approaches is presented in this paper. Firstly, the gesture portion is detected
by using the background separation method based on binary thresholding. After
that, the contour portion is extracted, and the hand region is segmented. Then,
the images have been resized and fed into three individual CNN models to train
them in parallel. In the last part, the output scores of CNN models are
averaged to construct an optimal ensemble model for the final prediction. Two
publicly available datasets (labeled as Dataset-1 and Dataset-2) containing
infrared images and one self-constructed dataset have been used to validate the
proposed system. Experimental results are compared with the existing
state-of-the-art approaches, and it is observed that our proposed ensemble
model outperforms other existing proposed methods.
- Abstract(参考訳): 近年,ハンドジェスチャ認識がヒューマンマシンインタラクションの代替手段となっている。
3Dゲーム技術、手話解釈、VR(バーチャルリアリティ)環境、ロボット工学など、幅広い応用分野をカバーしている。
しかし、手の部分の検出はコンピュータビジョンやパターン認識のコミュニティでは難しい課題となっている。
convolutional neural network(cnn)アーキテクチャのようなディープラーニングアルゴリズムは、分類タスクにおいて非常に一般的な選択肢となっているが、cnnアーキテクチャは、予測中の高い分散、問題オーバーフィット、予測エラーなどの問題に苦しめられている。
本稿では,これらの問題を克服するために,CNNに基づくアプローチのアンサンブルについて述べる。
まず、二分しきい値に基づく背景分離法を用いてジェスチャー部分を検出する。
その後、輪郭部を抽出し、手領域を分割する。
その後、画像は3つの個別のCNNモデルに変換され、並列にトレーニングされる。
最後に、CNNモデルの出力スコアを平均化し、最終的な予測のための最適なアンサンブルモデルを構築する。
提案システムを検証するために、赤外線画像と1つの自己構築データセットを含む2つの公開データセット(Dataset-1とDataset-2)が使用されている。
実験結果は,既存の最先端手法と比較し,提案手法が既存手法よりも優れていることを示した。
関連論文リスト
- An evaluation of CNN models and data augmentation techniques in hierarchical localization of mobile robots [0.0]
本研究では,移動ロボットの階層的位置決めを行うために,CNNモデルの評価とデータ拡張を行う。
この意味では、バックボーンとして使用される様々な最先端CNNモデルのアブレーション研究を示す。
ロボットの視覚的ローカライゼーションに対処するために,様々なデータ拡張視覚効果を提案する。
論文 参考訳(メタデータ) (2024-07-15T10:20:00Z) - A Domain Decomposition-Based CNN-DNN Architecture for Model Parallel Training Applied to Image Recognition Problems [0.0]
モデル並列トレーニング戦略を自然にサポートする新しいCNN-DNNアーキテクチャを提案する。
提案手法は,グローバルモデルと比較して,必要なトレーニング時間を著しく短縮することができる。
その結果,提案手法は,基礎となる分類問題の精度向上にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-02-13T18:06:59Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Lost Vibration Test Data Recovery Using Convolutional Neural Network: A
Case Study [0.0]
本稿では,アラモサキャニオン橋のCNNアルゴリズムを実構造として提案する。
3つの異なるCNNモデルは、1つと2つの故障したセンサーを予測するものとされた。
畳み込み層を追加することによりモデルの精度が向上した。
論文 参考訳(メタデータ) (2022-04-11T23:24:03Z) - Keypoint Message Passing for Video-based Person Re-Identification [106.41022426556776]
ビデオベースの人物再識別(re-ID)は、異なるカメラで捉えた人々のビデオスニペットをマッチングすることを目的とした、視覚監視システムにおいて重要な技術である。
既存の手法は主に畳み込みニューラルネットワーク(CNN)に基づいており、そのビルディングブロックは近隣のピクセルを一度に処理するか、あるいは3D畳み込みが時間情報のモデル化に使用される場合、人の動きによって生じるミスアライメントの問題に悩まされる。
本稿では,人間指向グラフ法を用いて,通常の畳み込みの限界を克服することを提案する。具体的には,人手指のキーポイントに位置する特徴を抽出し,時空間グラフとして接続する。
論文 参考訳(メタデータ) (2021-11-16T08:01:16Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文 参考訳(メタデータ) (2020-11-23T07:55:24Z) - AutoSpeech: Neural Architecture Search for Speaker Recognition [108.69505815793028]
本稿では,AutoSpeech という名称の話者認識タスクに対して,最初のニューラルアーキテクチャ探索アプローチを提案する。
提案アルゴリズムはまず,ニューラルネットワークの最適操作の組み合わせを特定し,その後,複数回重ねてCNNモデルを導出する。
得られたCNNアーキテクチャは,モデル複雑性を低減しつつ,VGG-M,ResNet-18,ResNet-34のバックボーンに基づく現在の話者認識システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-05-07T02:53:47Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Inferring Convolutional Neural Networks' accuracies from their
architectural characterizations [0.0]
CNNのアーキテクチャと性能の関係について検討する。
本稿では,2つのコンピュータビジョンに基づく物理問題において,その特性がネットワークの性能を予測できることを示す。
我々は機械学習モデルを用いて、トレーニング前にネットワークが一定のしきい値精度よりも優れた性能を発揮できるかどうかを予測する。
論文 参考訳(メタデータ) (2020-01-07T16:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。