論文の概要: Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions
- arxiv url: http://arxiv.org/abs/2507.04465v1
- Date: Sun, 06 Jul 2025 17:03:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.197911
- Title: Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions
- Title(参考訳): 深層学習による視覚的手のジェスチャー認識:方法,データセット,課題,今後の研究方向の総合的考察
- Authors: Konstantinos Foteinos, Jorgen Cani, Manousos Linardakis, Panagiotis Radoglou-Grammatikis, Vasileios Argyriou, Panagiotis Sarigiannidis, Iraklis Varlamis, Georgios Th. Papadopoulos,
- Abstract要約: 視覚に基づく手ジェスチャー認識(VHGR)は、手話理解やカメラを用いた人間とコンピュータのインタラクションなど、幅広い用途を提供する。
この分野での膨大な研究にもかかわらず、VHGRに関する構造化された完全な調査はいまだに欠落している。
このレビューは、研究者が特定のVHGRタスクをディビングするための適切な戦略を選択するのを助けるために有用なガイドラインを構成することを目的としている。
- 参考スコア(独自算出の注目度): 5.983872847786255
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of deep learning (DL) models and the ever-increasing size of available datasets have raised the interest of the research community in the always important field of vision-based hand gesture recognition (VHGR), and delivered a wide range of applications, such as sign language understanding and human-computer interaction using cameras. Despite the large volume of research works in the field, a structured and complete survey on VHGR is still missing, leaving researchers to navigate through hundreds of papers in order to find the right combination of data, model, and approach for each task. The current survey aims to fill this gap by presenting a comprehensive overview of this aspect of computer vision. With a systematic research methodology that identifies the state-of-the-art works and a structured presentation of the various methods, datasets, and evaluation metrics, this review aims to constitute a useful guideline for researchers, helping them to choose the right strategy for delving into a certain VHGR task. Starting with the methodology used for study selection, literature retrieval, and the analytical framing, the survey identifies and organizes key VHGR approaches using a taxonomy-based format in various dimensions such as input modality and application domain. The core of the survey provides an in-depth analysis of state-of-the-art techniques across three primary VHGR tasks: static gesture recognition, isolated dynamic gestures and continuous gesture recognition. For each task, the architectural trends and learning strategies are listed. Additionally, the study reviews commonly used datasets - emphasizing on annotation schemes - and evaluates standard performance metrics. It concludes by identifying major challenges in VHGR, including both general computer vision issues and domain-specific obstacles, and outlines promising directions for future research.
- Abstract(参考訳): ディープラーニング(DL)モデルの急速な進化と利用可能なデータセットの増大は、常に重要な視覚ベースの手ジェスチャー認識(VHGR)分野における研究コミュニティの関心を高め、手話理解やカメラを用いた人間とコンピュータのインタラクションなど、幅広い応用を提供した。
この分野での膨大な研究にもかかわらず、VHGRに関する構造化された完全な調査は依然として欠落しており、研究者は各タスクにデータ、モデル、アプローチの適切な組み合わせを見つけるために何百もの論文をナビゲートしなければならない。
現在の調査は、コンピュータビジョンのこの側面を包括的に概観することで、このギャップを埋めることを目的としている。
本研究は,最先端の作業の特定と各種手法,データセット,評価指標の構造化された提示を行う体系的な研究手法を用いて,研究者にとって有用なガイドラインを構築し,特定のVHGRタスクを掘り下げるための適切な戦略の選択を支援することを目的とする。
研究選択、文献検索、分析フレーミングに使用される方法論から始め、入力モダリティやアプリケーションドメインといった様々な次元の分類に基づく形式を用いて、主要なVHGRアプローチを特定し、整理する。
調査のコアは、静的ジェスチャー認識、分離された動的ジェスチャー、連続的なジェスチャー認識という3つの主要なVHGRタスクにわたる最先端技術に関する詳細な分析を提供する。
各タスクについて、アーキテクチャのトレンドと学習戦略を列挙する。
さらに、この調査では、アノテーションスキームを強調したデータセットを一般的に使用し、標準的なパフォーマンス指標を評価している。
これは、一般的なコンピュータビジョン問題とドメイン固有の障害の両方を含む、VHGRにおける大きな課題を特定し、将来の研究に向けた有望な方向性を概説することで締めくくっている。
関連論文リスト
- Survey on Hand Gesture Recognition from Visual Input [2.1591725778863555]
ハンドジェスチャ認識は人間とコンピュータの相互作用の需要が増大する中で重要な研究領域となっている。
最近の研究、利用可能なソリューション、ベンチマークデータセットを包括的にカバーする調査はほとんどない。
本研究は,様々なカメラ入力データから手の動きと3次元手ポーズ認識の最新の進歩を調べることで,このギャップに対処する。
論文 参考訳(メタデータ) (2025-01-21T09:23:22Z) - A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data Modalities [1.6144710323800757]
ハンドジェスチャ認識(HGR)システムは、自然、効率的、そして認証された人間とコンピュータの相互作用を促進する。
大幅な進歩にもかかわらず、手の動きを自動的かつ正確に識別することはコンピュータビジョンにおいて大きな課題である。
本稿では,2014年から2024年までのHGR技術とデータモダリティを概観し,センサ技術とコンピュータビジョンの進歩を探求する。
論文 参考訳(メタデータ) (2024-08-10T04:40:01Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and Future [6.4105103117533755]
分類学は、まず様々なタスクと方法論を整理するために開発された。
提案した分類法は、オブジェクト検出、セマンティック/インスタンス/パノプティクスのセグメンテーション、3Dとビデオの理解など、さまざまなタスクにまたがって普遍的である。
論文 参考訳(メタデータ) (2023-07-18T12:52:49Z) - Scene Graph Generation: A Comprehensive Survey [35.80909746226258]
シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
SGG(Scene Graph Generation)とは、画像を自動的にセマンティックなシーングラフにマッピングするタスクである。
本稿では,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,既存の画像ベースSGGの手法を体系的に要約する。
論文 参考訳(メタデータ) (2022-01-03T00:55:33Z) - Fine-Grained Image Analysis with Deep Learning: A Survey [146.22351342315233]
きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
論文 参考訳(メタデータ) (2021-11-11T09:43:56Z) - Deep Gait Recognition: A Survey [15.47582611826366]
歩行認識は、歩き方に基づいて個人を識別することを目的とした魅力的な生体測定モダリティです。
ディープラーニングは、差別的な表現を自動的に学習する能力によって、2015年からこの分野の研究環境を再構築した。
深層学習による歩行認識のブレークスルーと最近の展開を総合的に紹介します。
論文 参考訳(メタデータ) (2021-02-18T18:49:28Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。