Fugu-MT 論文翻訳(概要): Dynamic LIBRAS Gesture Recognition via CNN over Spatiotemporal Matrix Representation

論文の概要: Dynamic LIBRAS Gesture Recognition via CNN over Spatiotemporal Matrix Representation

arxiv url: http://arxiv.org/abs/2603.25863v1
Date: Thu, 26 Mar 2026 19:37:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.252879
Title: Dynamic LIBRAS Gesture Recognition via CNN over Spatiotemporal Matrix Representation
Title（参考訳）: 時空間行列表現によるCNNによる動的LIBRASジェスチャー認識
Authors: Jasmine Moreira,
Abstract要約: 本稿では,メディアパイプハンドラと畳み込みニューラルネットワーク(CNN)の2つのモデルの構成に基づく動的手動作認識手法を提案する。本手法は、ホームオートメーションシステムにおけるデバイス制御のためのRASLIB(Brazilian Sign Language)ジェスチャの認識に適用され、静的および動的ジェスチャの11クラスをカバーする。低照度条件では95%の精度で、通常の照明では92%の精度で測定された。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper proposes a method for dynamic hand gesture recognition based on the composition of two models: the MediaPipe Hand Landmarker, responsible for extracting 21 skeletal keypoints of the hand, and a convolutional neural network (CNN) trained to classify gestures from a spatiotemporal matrix representation of dimensions 90 by 21 of those keypoints. The method is applied to the recognition of LIBRAS (Brazilian Sign Language) gestures for device control in a home automation system, covering 11 classes of static and dynamic gestures. For real-time inference, a sliding window with temporal frame triplication is used, enabling continuous recognition without recurrent networks. Tests achieved 95\% accuracy under low-light conditions and 92\% under normal lighting. The results indicate that the approach is effective, although systematic experiments with greater user diversity are needed for a more thorough evaluation of generalization.
Abstract（参考訳）: 本稿では,手指の21個のキーポイントを抽出するMediaPipe Hand Landmarkerと,それらのキーポイントの90×21の時空間行列表現からジェスチャーを分類するために訓練された畳み込みニューラルネットワーク(CNN)の2つのモデルで構成された動的手指認識法を提案する。本手法は、ホームオートメーションシステムにおけるデバイス制御のためのLIBRAS(Brazilian Sign Language)ジェスチャーの認識に適用され、11種類の静的および動的ジェスチャーをカバーしている。リアルタイム推論には、時間的フレームトリプリケーションを備えたスライディングウィンドウを使用し、繰り返しネットワークを使わずに連続的な認識を可能にする。低照度条件では95%の精度、標準照度では92の精度を達成した。提案手法は, より詳細な一般化評価を行うには, より多様なユーザによる体系的な実験が必要であるが, 有効であることを示す。

関連論文リスト

Towards Arbitrary Motion Completing via Hierarchical Continuous Representation [64.6525112550758]
Inlicit Representations(INR)に基づくNAMEと呼ばれる新しいパラメトリックアクティベーションによる階層的暗黙表現フレームワークを提案する。本手法では,複数の時間スケールで動作列から特徴を抽出し,複雑な時間パターンを効果的に捕捉する階層的時間符号化機構を提案する。
論文参考訳（メタデータ） (2025-12-24T14:07:04Z)
Accurate online action and gesture recognition system using detectors and Deep SPD Siamese Networks [4.667044415202222]
本稿では,2つの主成分である検出器と分類器から構成されるスケルトンシーケンスストリームのオンライン認識システムを提案する。検出器は柔軟で、運動状態を連続的に識別することができる。身振りと身体動作認識のベンチマークを用いて、オンライン認識システムの精度を検証した。
論文参考訳（メタデータ） (2025-11-07T14:09:43Z)
Skeleton2vec: A Self-supervised Learning Framework with Contextualized Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文参考訳（メタデータ） (2024-01-01T12:08:35Z)
Adaptive Local-Component-aware Graph Convolutional Network for One-shot Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文参考訳（メタデータ） (2022-09-21T02:33:07Z)
Towards Domain-Independent and Real-Time Gesture Recognition Using mmWave Signal [11.76969975145963]
DI-Gesture はドメインに依存しないリアルタイムの mmWave ジェスチャー認識システムである。リアルタイムシナリオでは、DI-Gesutreの精度は平均推定時間2.87msで97%以上に達する。
論文参考訳（メタデータ） (2021-11-11T13:28:28Z)
Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble [71.97020373520922]
手話は一般的に、聴覚障害者やミュート人がコミュニケーションするために使われる。孤立手話認識(SLR)のためのGlobal Ensemble Model(GEM)を用いた新しいマルチモーダルフレームワークを提案する。提案するSAM-SLR-v2 フレームワークは極めて有効であり,最先端の性能を高いマージンで達成している。
論文参考訳（メタデータ） (2021-10-12T16:57:18Z)
HAN: An Efficient Hierarchical Self-Attention Network for Skeleton-Based Gesture Recognition [73.64451471862613]
骨格に基づくジェスチャー認識のための効率的な階層型自己認識ネットワーク(HAN)を提案する。ジョイント・セルフアテンション・モジュールは指の空間的特徴を捉え、指の自己アテンション・モジュールは手全体の特徴を集約するように設計されている。実験の結果,3つのジェスチャ認識データセットに対して,計算複雑性がはるかに低い競合的な結果が得られることがわかった。
論文参考訳（メタデータ） (2021-06-25T02:15:53Z)
SHREC 2021: Track on Skeleton-based Hand Gesture Recognition in the Wild [62.450907796261646]
手のジェスチャーの認識は、ソフトウェアによって推定される手の骨格のストリームから直接行うことができる。最近のスケルトンからのジェスチャーや行動認識の進歩にもかかわらず、現在の最先端技術が現実のシナリオでどの程度うまく機能するかは明らかではない。本稿では,SHREC 2021: Track on Skeleton-based Hand Gesture Recognition in the Wild contestについて述べる。
論文参考訳（メタデータ） (2021-06-21T10:57:49Z)
Understanding the hand-gestures using Convolutional Neural Networks and Generative Adversial Networks [0.0]
このシステムは、リアルタイムハンドトラッキング、トレーニングジェスチャ、および畳み込みニューラルネットワークを用いたジェスチャー認識の3つのモジュールで構成されている。アルファベットや数字を含む36のジェスチャーの語彙でテストされ、アプローチの有効性が検証されている。
論文参考訳（メタデータ） (2020-11-10T02:20:43Z)
Gesture Recognition from Skeleton Data for Intuitive Human-Machine Interaction [0.6875312133832077]
本稿では,手工芸品の集合に基づく動的ジェスチャーのセグメント化と分類のためのアプローチを提案する。ジェスチャー認識方法はスライディングウィンドウを適用し、空間次元と時間次元の両方から情報を抽出する。最終的に、認識されたジェスチャーは、協調ロボットと対話するために使用される。
論文参考訳（メタデータ） (2020-08-26T11:28:50Z)
3D dynamic hand gestures recognition using the Leap Motion sensor and convolutional neural networks [0.0]
本稿では,Leap Motionセンサーを用いて取得した非静的なジェスチャーの認識方法を提案する。取得したジェスチャー情報をカラー画像に変換し、ジェスチャー中の手関節位置の変化を平面に投影する。ジェスチャーの分類はDeep Convolutional Neural Network (CNN)を用いて行われる。
論文参考訳（メタデータ） (2020-03-03T11:05:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。