論文の概要: Control of Computer Pointer Using Hand Gesture Recognition in Motion
Pictures
- arxiv url: http://arxiv.org/abs/2012.13188v2
- Date: Fri, 9 Jun 2023 21:49:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 03:38:11.072675
- Title: Control of Computer Pointer Using Hand Gesture Recognition in Motion
Pictures
- Title(参考訳): モーション画像におけるハンドジェスチャ認識を用いたコンピュータポインターの制御
- Authors: Yalda Foroutan, Ahmad Kalhor, Saeid Mohammadi Nejati, Samad Sheikhaei
- Abstract要約: 本稿では,手動検出とジェスチャー分類によるコンピュータカーソル制御を実現するユーザインタフェースを提案する。
6720の画像サンプルからなる総合的な手データセットを収集し、拳、掌、左指、右指の4つの異なるクラスを含む。
画像は、15人の個人からさまざまな設定で撮影されました。
このデータセット上で畳み込みニューラルネットワーク(CNN)をトレーニングし、キャプチャされた各画像のラベルを正確に予測し、それらの類似性を測定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a user interface designed to enable computer cursor
control through hand detection and gesture classification. A comprehensive hand
dataset comprising 6720 image samples was collected, encompassing four distinct
classes: fist, palm, pointing to the left, and pointing to the right. The
images were captured from 15 individuals in various settings, including simple
backgrounds with different perspectives and lighting conditions. A
convolutional neural network (CNN) was trained on this dataset to accurately
predict labels for each captured image and measure their similarity. The system
incorporates defined commands for cursor movement, left-click, and right-click
actions. Experimental results indicate that the proposed algorithm achieves a
remarkable accuracy of 91.88% and demonstrates its potential applicability
across diverse backgrounds.
- Abstract(参考訳): 本稿では,手動検出とジェスチャー分類によるコンピュータカーソル制御を実現するユーザインタフェースを提案する。
6720の画像サンプルからなる包括的ハンドデータセットを収集し、拳、掌、左指、右指の4つの異なるクラスを包括した。
画像は、異なる視点と照明条件のシンプルな背景を含む、さまざまな環境で15人の個人から撮影された。
このデータセット上で畳み込みニューラルネットワーク(cnn)を訓練し、キャプチャした画像ごとにラベルを正確に予測し、類似度を測定する。
このシステムは、カーソル移動、左クリック、右クリックのアクションで定義されたコマンドを組み込む。
実験結果から,提案アルゴリズムは91.88%の精度を達成し,その適用可能性を示した。
関連論文リスト
- Readout Guidance: Learning Control from Diffusion Features [96.22155562120231]
本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。
Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。
これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文 参考訳(メタデータ) (2023-12-04T18:59:32Z) - CLIPC8: Face liveness detection algorithm based on image-text pairs and
contrastive learning [3.90443799528247]
画像テキストペアとコントラスト学習に基づく顔の生存度検出手法を提案する。
提案手法は,特定のシナリオにおいて,特定の生きた攻撃行動を効果的に検出することができる。
また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
論文 参考訳(メタデータ) (2023-11-29T12:21:42Z) - Towards Generic Image Manipulation Detection with Weakly-Supervised
Self-Consistency Learning [49.43362803584032]
本稿では,弱い教師付き画像操作検出を提案する。
このような設定は、より多くのトレーニングイメージを活用することができ、新しい操作テクニックに迅速に適応する可能性がある。
マルチソース整合性(MSC)とパッチ整合性(IPC)の2つの一貫性特性が学習される。
論文 参考訳(メタデータ) (2023-09-03T19:19:56Z) - Simultaneous prediction of hand gestures, handedness, and hand keypoints
using thermal images [0.6087960723103347]
赤外線カメラで捉えたサーマルデータを用いて手指のジェスチャー分類,手指検出,手指キーポイントの局所化を同時に行う手法を提案する。
提案手法は,共有エンコーダデコーダ層を含む新しい深層マルチタスク学習アーキテクチャを用いて,各タスクに専用の3つのブランチを付加する。
論文 参考訳(メタデータ) (2023-03-02T19:25:40Z) - HaGRID - HAnd Gesture Recognition Image Dataset [79.21033185563167]
本稿では,ハンドジェスチャ認識システム構築のための巨大なデータセットであるHaGRIDを紹介し,それを管理するデバイスとのインタラクションに着目した。
ジェスチャーは静的だが、特にいくつかの動的ジェスチャーを設計する能力のために拾われた。
HaGRIDには54,800の画像とジェスチャーラベル付きバウンディングボックスアノテーションが含まれており、手検出とジェスチャー分類のタスクを解決している。
論文 参考訳(メタデータ) (2022-06-16T14:41:32Z) - Efficient Gesture Recognition for the Assistance of Visually Impaired
People using Multi-Head Neural Networks [5.883916678819684]
本稿では,視覚障害者支援を目的とした手ジェスチャーによって制御されるモバイルデバイスの対話型システムを提案する。
このシステムにより、ユーザーはシンプルな静的、ダイナミックな手の動きをすることでデバイスと対話できる。
各ジェスチャーは、オブジェクト認識、シーン記述、イメージスケーリングなど、システム内の異なるアクションをトリガーする。
論文 参考訳(メタデータ) (2022-05-14T06:01:47Z) - Unified Contrastive Learning in Image-Text-Label Space [130.31947133453406]
Unified Contrastive Learning (UniCL)は、意味的に豊かだが差別的な表現を学習する効果的な方法である。
UniCLスタンドアローンは、3つの画像分類データセットにまたがる教師あり学習手法に対抗して、純粋な画像ラベルデータに関する優れた学習者である。
論文 参考訳(メタデータ) (2022-04-07T17:34:51Z) - Hand gesture detection in tests performed by older adults [9.00837522898458]
我々は、年齢に伴う手の動きの特徴を分析するオンラインテストを開発している。
手の動きの特徴を得るために、参加者は自分のコンピュータカメラを使って様々な手の動きを行うよう依頼される。
特に高齢者を対象に,高品質な手動動画データを収集することは困難である。
論文 参考訳(メタデータ) (2021-10-27T14:29:01Z) - A deep-learning--based multimodal depth-aware dynamic hand gesture
recognition system [5.458813674116228]
深度定量化画像ハンドスケルトン関節点を用いたダイナミックハンドジェスチャ認識(DHG)に着目した。
特に,CNNとリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を用いたマルチモーダル核融合ネットワークにおける深度量子化の効果について検討する。
論文 参考訳(メタデータ) (2021-07-06T11:18:53Z) - DeepDarts: Modeling Keypoints as Objects for Automatic Scorekeeping in
Darts using a Single Camera [75.34178733070547]
既存のマルチカメラソリューションは、スチールチップダーツの自動スコア管理に非常に高価であり、ほとんどのプレイヤーにはアクセスできない。
キーポイント検出に対する新しいアプローチを提案し,任意のカメラアングルから撮影した単一の画像からダートスコアを予測する。
我々は、このアイデアにまつわる深い畳み込みニューラルネットワークを開発し、ダート位置とダートボードの校正点を予測する。
論文 参考訳(メタデータ) (2021-05-20T16:25:57Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。