論文の概要: Control of computer pointer using hand gesture recognition in motion
pictures
- arxiv url: http://arxiv.org/abs/2012.13188v1
- Date: Thu, 24 Dec 2020 10:24:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 08:08:50.717373
- Title: Control of computer pointer using hand gesture recognition in motion
pictures
- Title(参考訳): モーション画像におけるハンドジェスチャ認識を用いたコンピュータポインターの制御
- Authors: Yalda Foroutan, Ahmad Kalhor, Saeid Mohammadi Nejati, Samad Sheikhaei
- Abstract要約: ユーザインタフェースは、手動検出とジェスチャーの分類によってコンピュータカーソルを制御するように設計されている。
6720の画像サンプルを持つハンドデータセットは、拳、手のひら、左を指し、右を指す4つのクラスを含む収集されます。
CNNネットワークはこのデータセットで訓練され、キャプチャされた各画像のラベルを予測し、それらの類似度を測定します。
- 参考スコア(独自算出の注目度): 0.16058099298620418
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A user interface is designed to control the computer cursor by hand detection
and classification of its gesture. A hand dataset with 6720 image samples is
collected, including four classes: fist, palm, pointing to the left, and
pointing to the right. The images are captured from 15 persons in simple
backgrounds and different perspectives and light conditions. A CNN network is
trained on this dataset to predict a label for each captured image and measure
the similarity of them. Finally, commands are defined to click, right-click and
move the cursor. The algorithm has 91.88% accuracy and can be used in different
backgrounds.
- Abstract(参考訳): ユーザインタフェースは、手動検出とジェスチャーの分類によってコンピュータカーソルを制御するように設計されている。
6720の画像サンプルを持つハンドデータセットを収集し、拳、掌、左向け、右向きの4つのクラスを含む。
画像は、単純な背景と異なる視点と光条件で15人の人物から撮影されます。
CNNネットワークは、このデータセットに基づいてトレーニングされ、キャプチャされた各画像のラベルを予測し、それらの類似度を測定する。
最後に、コマンドはクリック、右クリック、カーソルの移動と定義される。
このアルゴリズムは91.88%の精度を持ち、異なるバックグラウンドで使用できる。
関連論文リスト
- Readout Guidance: Learning Control from Diffusion Features [96.22155562120231]
本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。
Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。
これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文 参考訳(メタデータ) (2023-12-04T18:59:32Z) - CLIPC8: Face liveness detection algorithm based on image-text pairs and
contrastive learning [3.90443799528247]
画像テキストペアとコントラスト学習に基づく顔の生存度検出手法を提案する。
提案手法は,特定のシナリオにおいて,特定の生きた攻撃行動を効果的に検出することができる。
また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
論文 参考訳(メタデータ) (2023-11-29T12:21:42Z) - Towards Generic Image Manipulation Detection with Weakly-Supervised
Self-Consistency Learning [49.43362803584032]
本稿では,弱い教師付き画像操作検出を提案する。
このような設定は、より多くのトレーニングイメージを活用することができ、新しい操作テクニックに迅速に適応する可能性がある。
マルチソース整合性(MSC)とパッチ整合性(IPC)の2つの一貫性特性が学習される。
論文 参考訳(メタデータ) (2023-09-03T19:19:56Z) - Simultaneous prediction of hand gestures, handedness, and hand keypoints
using thermal images [0.6087960723103347]
赤外線カメラで捉えたサーマルデータを用いて手指のジェスチャー分類,手指検出,手指キーポイントの局所化を同時に行う手法を提案する。
提案手法は,共有エンコーダデコーダ層を含む新しい深層マルチタスク学習アーキテクチャを用いて,各タスクに専用の3つのブランチを付加する。
論文 参考訳(メタデータ) (2023-03-02T19:25:40Z) - HaGRID - HAnd Gesture Recognition Image Dataset [79.21033185563167]
本稿では,ハンドジェスチャ認識システム構築のための巨大なデータセットであるHaGRIDを紹介し,それを管理するデバイスとのインタラクションに着目した。
ジェスチャーは静的だが、特にいくつかの動的ジェスチャーを設計する能力のために拾われた。
HaGRIDには54,800の画像とジェスチャーラベル付きバウンディングボックスアノテーションが含まれており、手検出とジェスチャー分類のタスクを解決している。
論文 参考訳(メタデータ) (2022-06-16T14:41:32Z) - Efficient Gesture Recognition for the Assistance of Visually Impaired
People using Multi-Head Neural Networks [5.883916678819684]
本稿では,視覚障害者支援を目的とした手ジェスチャーによって制御されるモバイルデバイスの対話型システムを提案する。
このシステムにより、ユーザーはシンプルな静的、ダイナミックな手の動きをすることでデバイスと対話できる。
各ジェスチャーは、オブジェクト認識、シーン記述、イメージスケーリングなど、システム内の異なるアクションをトリガーする。
論文 参考訳(メタデータ) (2022-05-14T06:01:47Z) - Unified Contrastive Learning in Image-Text-Label Space [130.31947133453406]
Unified Contrastive Learning (UniCL)は、意味的に豊かだが差別的な表現を学習する効果的な方法である。
UniCLスタンドアローンは、3つの画像分類データセットにまたがる教師あり学習手法に対抗して、純粋な画像ラベルデータに関する優れた学習者である。
論文 参考訳(メタデータ) (2022-04-07T17:34:51Z) - Hand gesture detection in tests performed by older adults [9.00837522898458]
我々は、年齢に伴う手の動きの特徴を分析するオンラインテストを開発している。
手の動きの特徴を得るために、参加者は自分のコンピュータカメラを使って様々な手の動きを行うよう依頼される。
特に高齢者を対象に,高品質な手動動画データを収集することは困難である。
論文 参考訳(メタデータ) (2021-10-27T14:29:01Z) - A deep-learning--based multimodal depth-aware dynamic hand gesture
recognition system [5.458813674116228]
深度定量化画像ハンドスケルトン関節点を用いたダイナミックハンドジェスチャ認識(DHG)に着目した。
特に,CNNとリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を用いたマルチモーダル核融合ネットワークにおける深度量子化の効果について検討する。
論文 参考訳(メタデータ) (2021-07-06T11:18:53Z) - DeepDarts: Modeling Keypoints as Objects for Automatic Scorekeeping in
Darts using a Single Camera [75.34178733070547]
既存のマルチカメラソリューションは、スチールチップダーツの自動スコア管理に非常に高価であり、ほとんどのプレイヤーにはアクセスできない。
キーポイント検出に対する新しいアプローチを提案し,任意のカメラアングルから撮影した単一の画像からダートスコアを予測する。
我々は、このアイデアにまつわる深い畳み込みニューラルネットワークを開発し、ダート位置とダートボードの校正点を予測する。
論文 参考訳(メタデータ) (2021-05-20T16:25:57Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。