論文の概要: Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions
- arxiv url: http://arxiv.org/abs/2507.04465v2
- Date: Sun, 09 Nov 2025 13:30:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.377162
- Title: Visual Hand Gesture Recognition with Deep Learning: A Comprehensive Review of Methods, Datasets, Challenges and Future Research Directions
- Title(参考訳): 深層学習による視覚的手のジェスチャー認識:方法,データセット,課題,今後の研究方向の総合的考察
- Authors: Konstantinos Foteinos, Jorgen Cani, Manousos Linardakis, Panagiotis Radoglou-Grammatikis, Vasileios Argyriou, Panagiotis Sarigiannidis, Iraklis Varlamis, Georgios Th. Papadopoulos,
- Abstract要約: このレビューは、研究者がVHGRタスクを扱うための適切な戦略を選択するのに役立つ有用なガイドラインを構成することを目的としている。
最先端技術は静的ジェスチャー認識、分離された動的ジェスチャー、連続的なジェスチャー認識という3つの主要なVHGRタスクにグループ化される。
我々の調査は、一般のコンピュータビジョン問題とドメイン固有の障害の両方を含む、VHGRにおける主要な課題を特定することで締めくくっている。
- 参考スコア(独自算出の注目度): 4.464813168730844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of deep learning (DL) models and the ever-increasing size of available datasets have raised the interest of the research community in the always important field of visual hand gesture recognition (VHGR), and delivered a wide range of applications, such as sign language understanding and human-computer interaction using cameras. Despite the large volume of research works in the field, a structured and complete survey on VHGR is still missing, leaving researchers to navigate through hundreds of papers in order to find the right combination of data, model, and approach for each task. The current survey aims to fill this gap by presenting a comprehensive overview of this computer vision field. With a systematic research methodology that identifies the state-of-the-art works and a structured presentation of the various methods, datasets, and evaluation metrics, this review aims to constitute a useful guideline for researchers, helping them to choose the right strategy for handling a VHGR task. Starting with the methodology used to locate the related literature, the survey identifies and organizes the key VHGR approaches in a taxonomy-based format, and presents the various dimensions that affect the final method choice, such as input modality, task type, and application domain. The state-of-the-art techniques are grouped across three primary VHGR tasks: static gesture recognition, isolated dynamic gestures, and continuous gesture recognition. For each task, the architectural trends and learning strategies are listed. To support the experimental evaluation of future methods in the field, the study reviews commonly used datasets and presents the standard performance metrics. Our survey concludes by identifying the major challenges in VHGR, including both general computer vision issues and domain-specific obstacles, and outlines promising directions for future research.
- Abstract(参考訳): ディープラーニング(DL)モデルの急速な進化と利用可能なデータセットの増大は、常に重要な視覚手ジェスチャ認識(VHGR)分野における研究コミュニティの関心を高め、手話理解やカメラを用いた人間とコンピュータのインタラクションなど、幅広い応用を提供した。
この分野での膨大な研究にもかかわらず、VHGRに関する構造化された完全な調査は依然として欠落しており、研究者は各タスクにデータ、モデル、アプローチの適切な組み合わせを見つけるために何百もの論文をナビゲートしなければならない。
本調査は,このコンピュータビジョン分野の包括的概要を提示することによって,このギャップを埋めることを目的としている。
本研究は,最先端の作業の特定と,様々な手法,データセット,評価指標の構造化された提示によって,研究者がVHGRタスクに対処するための適切な戦略を選択する上で有用なガイドラインを構築することを目的としている。
関連文献の特定に使用する方法論から,本調査では,VHGRの主要なアプローチを分類学的手法で識別,整理し,入力モダリティ,タスクタイプ,アプリケーションドメインなど,最終的なメソッド選択に影響を与えるさまざまな側面を提示する。
最先端技術は静的ジェスチャー認識、分離された動的ジェスチャー、連続的なジェスチャー認識という3つの主要なVHGRタスクにグループ化される。
各タスクについて、アーキテクチャのトレンドと学習戦略を列挙する。
この分野における今後の手法の実験的評価を支援するため、一般的に使われているデータセットをレビューし、標準性能指標を提示する。
我々の調査は、一般的なコンピュータビジョン問題とドメイン固有の障害の両方を含む、VHGRにおける主要な課題を特定し、今後の研究に向けての有望な方向性を概説することで締めくくっている。
関連論文リスト
- Object Recognition Datasets and Challenges: A Review [5.638005500131518]
本研究では,高度に調査された物体認識領域におけるデータセットの詳細な分析を行う。
本稿では,代表的なオブジェクト認識ベンチマークとコンペティションの概要を紹介する。
導入されたデータセットと課題はすべて、.com/AbtinDjavadifar/ORDCでオンラインで見ることができる。
論文 参考訳(メタデータ) (2025-07-30T03:56:37Z) - Personalized Generation In Large Model Era: A Survey [90.7579254803302]
大規模モデルの時代には、コンテンツ生成は徐々にパーソナライズドジェネレーション(PGen)へとシフトしている。
本報告では,PGen に関する総合的な調査を行い,この急速に成長する分野における既存研究について考察する。
複数のモダリティにまたがるPGen研究をブリッジすることで、この調査は知識共有と学際的コラボレーションを促進する貴重な情報源となる。
論文 参考訳(メタデータ) (2025-03-04T13:34:19Z) - G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.45837774534411]
ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-03-01T13:02:47Z) - Survey on Hand Gesture Recognition from Visual Input [2.1591725778863555]
ハンドジェスチャ認識は人間とコンピュータの相互作用の需要が増大する中で重要な研究領域となっている。
最近の研究、利用可能なソリューション、ベンチマークデータセットを包括的にカバーする調査はほとんどない。
本研究は,様々なカメラ入力データから手の動きと3次元手ポーズ認識の最新の進歩を調べることで,このギャップに対処する。
論文 参考訳(メタデータ) (2025-01-21T09:23:22Z) - A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data Modalities [1.6144710323800757]
ハンドジェスチャ認識(HGR)システムは、自然、効率的、そして認証された人間とコンピュータの相互作用を促進する。
大幅な進歩にもかかわらず、手の動きを自動的かつ正確に識別することはコンピュータビジョンにおいて大きな課題である。
本稿では,2014年から2024年までのHGR技術とデータモダリティを概観し,センサ技術とコンピュータビジョンの進歩を探求する。
論文 参考訳(メタデータ) (2024-08-10T04:40:01Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and Future [6.4105103117533755]
分類学は、まず様々なタスクと方法論を整理するために開発された。
提案した分類法は、オブジェクト検出、セマンティック/インスタンス/パノプティクスのセグメンテーション、3Dとビデオの理解など、さまざまなタスクにまたがって普遍的である。
論文 参考訳(メタデータ) (2023-07-18T12:52:49Z) - Scene Graph Generation: A Comprehensive Survey [35.80909746226258]
シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
SGG(Scene Graph Generation)とは、画像を自動的にセマンティックなシーングラフにマッピングするタスクである。
本稿では,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,既存の画像ベースSGGの手法を体系的に要約する。
論文 参考訳(メタデータ) (2022-01-03T00:55:33Z) - Fine-Grained Image Analysis with Deep Learning: A Survey [146.22351342315233]
きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
論文 参考訳(メタデータ) (2021-11-11T09:43:56Z) - Deep Gait Recognition: A Survey [15.47582611826366]
歩行認識は、歩き方に基づいて個人を識別することを目的とした魅力的な生体測定モダリティです。
ディープラーニングは、差別的な表現を自動的に学習する能力によって、2015年からこの分野の研究環境を再構築した。
深層学習による歩行認識のブレークスルーと最近の展開を総合的に紹介します。
論文 参考訳(メタデータ) (2021-02-18T18:49:28Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。