Fugu-MT 論文翻訳(概要): Control of computer pointer using hand gesture recognition in motion pictures

論文の概要: Control of computer pointer using hand gesture recognition in motion pictures

arxiv url: http://arxiv.org/abs/2012.13188v1
Date: Thu, 24 Dec 2020 10:24:51 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-25 08:08:50.717373
Title: Control of computer pointer using hand gesture recognition in motion pictures
Title（参考訳）: モーション画像におけるハンドジェスチャ認識を用いたコンピュータポインターの制御
Authors: Yalda Foroutan, Ahmad Kalhor, Saeid Mohammadi Nejati, Samad Sheikhaei
Abstract要約: ユーザインタフェースは、手動検出とジェスチャーの分類によってコンピュータカーソルを制御するように設計されている。 6720の画像サンプルを持つハンドデータセットは、拳、手のひら、左を指し、右を指す4つのクラスを含む収集されます。 CNNネットワークはこのデータセットで訓練され、キャプチャされた各画像のラベルを予測し、それらの類似度を測定します。
参考スコア（独自算出の注目度）: 0.16058099298620418
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A user interface is designed to control the computer cursor by hand detection and classification of its gesture. A hand dataset with 6720 image samples is collected, including four classes: fist, palm, pointing to the left, and pointing to the right. The images are captured from 15 persons in simple backgrounds and different perspectives and light conditions. A CNN network is trained on this dataset to predict a label for each captured image and measure the similarity of them. Finally, commands are defined to click, right-click and move the cursor. The algorithm has 91.88% accuracy and can be used in different backgrounds.
Abstract（参考訳）: ユーザインタフェースは、手動検出とジェスチャーの分類によってコンピュータカーソルを制御するように設計されている。 6720の画像サンプルを持つハンドデータセットを収集し、拳、掌、左向け、右向きの4つのクラスを含む。画像は、単純な背景と異なる視点と光条件で15人の人物から撮影されます。 CNNネットワークは、このデータセットに基づいてトレーニングされ、キャプチャされた各画像のラベルを予測し、それらの類似度を測定する。最後に、コマンドはクリック、右クリック、カーソルの移動と定義される。このアルゴリズムは91.88%の精度を持ち、異なるバックグラウンドで使用できる。

関連論文リスト

VGG Induced Deep Hand Sign Language Detection [0.0]
本研究は,異なる障害者を対象とした手振り認識システムを提案する。このモデルは、VGG-16netとして知られる畳み込みニューラルネットワークを使用して、広く使用されている画像データセット上でトレーニングされたモデルを構築する。実験の結果, 転送学習機構と画像データ拡張を組み合わせることで, VGG-16ネットの精度は約98%であった。
論文参考訳（メタデータ） (2026-01-13T06:39:29Z)
Readout Guidance: Learning Control from Diffusion Features [96.22155562120231]
本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。 Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文参考訳（メタデータ） (2023-12-04T18:59:32Z)
CLIPC8: Face liveness detection algorithm based on image-text pairs and contrastive learning [3.90443799528247]
画像テキストペアとコントラスト学習に基づく顔の生存度検出手法を提案する。提案手法は,特定のシナリオにおいて,特定の生きた攻撃行動を効果的に検出することができる。また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
論文参考訳（メタデータ） (2023-11-29T12:21:42Z)
Towards Generic Image Manipulation Detection with Weakly-Supervised Self-Consistency Learning [49.43362803584032]
本稿では,弱い教師付き画像操作検出を提案する。このような設定は、より多くのトレーニングイメージを活用することができ、新しい操作テクニックに迅速に適応する可能性がある。マルチソース整合性(MSC)とパッチ整合性(IPC)の2つの一貫性特性が学習される。
論文参考訳（メタデータ） (2023-09-03T19:19:56Z)
Simultaneous prediction of hand gestures, handedness, and hand keypoints using thermal images [0.6087960723103347]
赤外線カメラで捉えたサーマルデータを用いて手指のジェスチャー分類,手指検出,手指キーポイントの局所化を同時に行う手法を提案する。提案手法は,共有エンコーダデコーダ層を含む新しい深層マルチタスク学習アーキテクチャを用いて,各タスクに専用の3つのブランチを付加する。
論文参考訳（メタデータ） (2023-03-02T19:25:40Z)
HaGRID - HAnd Gesture Recognition Image Dataset [79.21033185563167]
本稿では,ハンドジェスチャ認識システム構築のための巨大なデータセットであるHaGRIDを紹介し,それを管理するデバイスとのインタラクションに着目した。ジェスチャーは静的だが、特にいくつかの動的ジェスチャーを設計する能力のために拾われた。 HaGRIDには54,800の画像とジェスチャーラベル付きバウンディングボックスアノテーションが含まれており、手検出とジェスチャー分類のタスクを解決している。
論文参考訳（メタデータ） (2022-06-16T14:41:32Z)
Efficient Gesture Recognition for the Assistance of Visually Impaired People using Multi-Head Neural Networks [5.883916678819684]
本稿では,視覚障害者支援を目的とした手ジェスチャーによって制御されるモバイルデバイスの対話型システムを提案する。このシステムにより、ユーザーはシンプルな静的、ダイナミックな手の動きをすることでデバイスと対話できる。各ジェスチャーは、オブジェクト認識、シーン記述、イメージスケーリングなど、システム内の異なるアクションをトリガーする。
論文参考訳（メタデータ） (2022-05-14T06:01:47Z)
Unified Contrastive Learning in Image-Text-Label Space [130.31947133453406]
Unified Contrastive Learning (UniCL)は、意味的に豊かだが差別的な表現を学習する効果的な方法である。 UniCLスタンドアローンは、3つの画像分類データセットにまたがる教師あり学習手法に対抗して、純粋な画像ラベルデータに関する優れた学習者である。
論文参考訳（メタデータ） (2022-04-07T17:34:51Z)
Hand gesture detection in tests performed by older adults [9.00837522898458]
我々は、年齢に伴う手の動きの特徴を分析するオンラインテストを開発している。手の動きの特徴を得るために、参加者は自分のコンピュータカメラを使って様々な手の動きを行うよう依頼される。特に高齢者を対象に,高品質な手動動画データを収集することは困難である。
論文参考訳（メタデータ） (2021-10-27T14:29:01Z)
A deep-learning--based multimodal depth-aware dynamic hand gesture recognition system [5.458813674116228]
深度定量化画像ハンドスケルトン関節点を用いたダイナミックハンドジェスチャ認識(DHG)に着目した。特に,CNNとリカレントニューラルネットワーク(Recurrent Neural Network, RNN)を用いたマルチモーダル核融合ネットワークにおける深度量子化の効果について検討する。
論文参考訳（メタデータ） (2021-07-06T11:18:53Z)
DeepDarts: Modeling Keypoints as Objects for Automatic Scorekeeping in Darts using a Single Camera [75.34178733070547]
既存のマルチカメラソリューションは、スチールチップダーツの自動スコア管理に非常に高価であり、ほとんどのプレイヤーにはアクセスできない。キーポイント検出に対する新しいアプローチを提案し,任意のカメラアングルから撮影した単一の画像からダートスコアを予測する。我々は、このアイデアにまつわる深い畳み込みニューラルネットワークを開発し、ダート位置とダートボードの校正点を予測する。
論文参考訳（メタデータ） (2021-05-20T16:25:57Z)
Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文参考訳（メタデータ） (2020-02-10T20:15:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。