論文の概要: A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data Modalities
- arxiv url: http://arxiv.org/abs/2408.05436v1
- Date: Sat, 10 Aug 2024 04:40:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 19:01:07.715801
- Title: A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data Modalities
- Title(参考訳): 各種データモダリティ間のハンドジェスチャ認識の方法論的・構造的考察
- Authors: Jungpil Shin, Abu Saleh Musa Miah, Md. Humaun Kabir, Md. Abdur Rahim, Abdullah Al Shiam,
- Abstract要約: ハンドジェスチャ認識(HGR)システムは、自然、効率的、そして認証された人間とコンピュータの相互作用を促進する。
大幅な進歩にもかかわらず、手の動きを自動的かつ正確に識別することはコンピュータビジョンにおいて大きな課題である。
本稿では,2014年から2024年までのHGR技術とデータモダリティを概観し,センサ技術とコンピュータビジョンの進歩を探求する。
- 参考スコア(独自算出の注目度): 1.6144710323800757
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Researchers have been developing Hand Gesture Recognition (HGR) systems to enhance natural, efficient, and authentic human-computer interaction, especially benefiting those who rely solely on hand gestures for communication. Despite significant progress, the automatic and precise identification of hand gestures remains a considerable challenge in computer vision. Recent studies have focused on specific modalities like RGB images, skeleton data, and spatiotemporal interest points. This paper provides a comprehensive review of HGR techniques and data modalities from 2014 to 2024, exploring advancements in sensor technology and computer vision. We highlight accomplishments using various modalities, including RGB, Skeleton, Depth, Audio, EMG, EEG, and Multimodal approaches and identify areas needing further research. We reviewed over 200 articles from prominent databases, focusing on data collection, data settings, and gesture representation. Our review assesses the efficacy of HGR systems through their recognition accuracy and identifies a gap in research on continuous gesture recognition, indicating the need for improved vision-based gesture systems. The field has experienced steady research progress, including advancements in hand-crafted features and deep learning (DL) techniques. Additionally, we report on the promising developments in HGR methods and the area of multimodal approaches. We hope this survey will serve as a potential guideline for diverse data modality-based HGR research.
- Abstract(参考訳): HGR(Hand Gesture Recognition, Hand Gesture Recognition)システムは、人間とコンピュータのインタラクションを自然に、効率よく、そして本物にするためのシステムだ。
大幅な進歩にもかかわらず、手ジェスチャーの自動的かつ正確な識別は、コンピュータビジョンにおいて大きな課題である。
近年の研究は、RGB画像、骨格データ、時空間的関心点などの特定のモダリティに焦点を当てている。
本稿では,2014年から2024年までのHGR技術とデータモダリティを概観し,センサ技術とコンピュータビジョンの進歩を探求する。
我々は、RGB、Skeleton、Depth、Audio、EMG、EEG、マルチモーダルアプローチなど、様々なモダリティを用いた成果を強調し、さらなる研究を必要とする分野を特定する。
我々は、データ収集、データ設定、ジェスチャ表現を中心に、著名なデータベースから200以上の記事をレビューした。
本報告では,HGRシステムの有効性を認識精度で評価し,連続的なジェスチャー認識研究のギャップを認識し,視力に基づくジェスチャーシステムの改善の必要性を示唆する。
この分野は、手作りの特徴の進歩や深層学習(DL)技術など、着実に研究が進んでいる。
さらに,HGR法とマルチモーダル手法の分野での有望な発展について報告する。
この調査が、多種多様なデータモダリティに基づくHGR研究のガイドとなることを願っている。
関連論文リスト
- A Comprehensive Methodological Survey of Human Activity Recognition Across Divers Data Modalities [2.916558661202724]
人間活動認識(HAR)システムは、人間の行動を理解し、それぞれの行動にラベルを割り当てることを目的としている。
HARは、RGB画像やビデオ、スケルトン、深度、赤外線、ポイントクラウド、イベントストリーム、オーディオ、アクセラレーション、レーダー信号など、さまざまなデータモダリティを利用することができる。
本稿は,2014年から2024年までのHARの最新の進歩に関する包括的調査である。
論文 参考訳(メタデータ) (2024-09-15T10:04:44Z) - A Survey of Deep Learning for Group-level Emotion Recognition [21.542551233204065]
グループレベルの感情認識(GER)は、人間の行動を分析する上で重要な領域である。
ディープラーニング(DL)技術の普及に伴い、ニューラルネットワークはGERへの関心が高まっている。
本稿では、GERに適用されたDL技術について概観的なレビューを行い、その分野の新しい分類法を提案する。
論文 参考訳(メタデータ) (2024-08-13T11:54:09Z) - Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models [0.6157382820537721]
この研究は、HuGaDB、PKU-MMD、LARa、TUGデータセットからの知覚データを用いている。
PO-MS-GCNとTransformerの2つのモデルが訓練され評価され、PO-MS-GCNは最先端モデルを上回った。
HuGaDBとTUGは高い精度とf1スコアを獲得し、LARaとPKU-MMDは低いスコアを示した。
論文 参考訳(メタデータ) (2024-06-24T13:44:06Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - Deepfake Generation and Detection: A Benchmark and Survey [134.19054491600832]
Deepfakeは、特定の条件下で非常にリアルな顔画像やビデオを作成するための技術だ。
この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。
本研究では, 顔交換, 顔再現, 話し顔生成, 顔属性編集の4つの代表的なディープフェイク分野の研究に焦点をあてる。
論文 参考訳(メタデータ) (2024-03-26T17:12:34Z) - Study and Survey on Gesture Recognition Systems [0.0]
本稿では,ゲーム,医療,家電,産業用ロボット,バーチャルリアリティといった多分野におけるジェスチャー認識システムの実装について論じる。
手話におけるジェスチャーの役割が研究され、既存のアプローチがレビューされている。
ジェスチャー認識システムを構築する際に直面する共通の課題も検討されている。
論文 参考訳(メタデータ) (2023-12-01T07:29:30Z) - TMHOI: Translational Model for Human-Object Interaction Detection [18.804647133922195]
人-物間相互作用(HOI)を検出するための革新的なグラフベースアプローチを提案する。
本手法は,空間的知識と意味的知識を統合することで,HOIの感情表現を効果的に捉える。
我々のアプローチは、既存の最先端のグラフベースの手法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2023-03-07T21:52:10Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z) - Relational Graph Learning on Visual and Kinematics Embeddings for
Accurate Gesture Recognition in Robotic Surgery [84.73764603474413]
本稿では,マルチモーダルグラフネットワーク(MRG-Net)の新たなオンラインアプローチを提案し,視覚情報とキネマティクス情報を動的に統合する。
本手法の有効性は, JIGSAWSデータセット上での最先端の成果で実証された。
論文 参考訳(メタデータ) (2020-11-03T11:00:10Z) - Survey on the Analysis and Modeling of Visual Kinship: A Decade in the
Making [66.72253432908693]
親和性認識は多くの実践的応用において難しい問題である。
我々は、多くの人にその見解を刺激した公開リソースとデータ課題についてレビューする。
10周年記念には、さまざまなkinベースのタスクのためのデモコードが用意されている。
論文 参考訳(メタデータ) (2020-06-29T13:25:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。