論文の概要: Continuous Saudi Sign Language Recognition: A Vision Transformer Approach
- arxiv url: http://arxiv.org/abs/2509.03467v1
- Date: Wed, 03 Sep 2025 16:44:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.598979
- Title: Continuous Saudi Sign Language Recognition: A Vision Transformer Approach
- Title(参考訳): 連続サウジアラビア手話認識 : ビジョントランスフォーマーアプローチ
- Authors: Soukeina Elhassen, Lama Al Khuzayem, Areej Alhothali, Ohoud Alzamzami, Nahed Alowaidi,
- Abstract要約: 手話(SL)は、聴覚障害者や聴覚障害者にとって不可欠なコミュニケーション形態であり、より広い社会内での関わりを可能にする。
その重要性にもかかわらず、SLに対する一般大衆の認識が限られているため、教育や専門の機会に不平等にアクセスできることがしばしばある。
84,000人以上の個人が主要なコミュニケーション形態としてサウジアラビア手話(SSL)に依存している。
- 参考スコア(独自算出の注目度): 0.6561742884593001
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Sign language (SL) is an essential communication form for hearing-impaired and deaf people, enabling engagement within the broader society. Despite its significance, limited public awareness of SL often leads to inequitable access to educational and professional opportunities, thereby contributing to social exclusion, particularly in Saudi Arabia, where over 84,000 individuals depend on Saudi Sign Language (SSL) as their primary form of communication. Although certain technological approaches have helped to improve communication for individuals with hearing impairments, there continues to be an urgent requirement for more precise and dependable translation techniques, especially for Arabic sign language variants like SSL. Most state-of-the-art solutions have primarily focused on non-Arabic sign languages, resulting in a considerable absence of resources dedicated to Arabic sign language, specifically SSL. The complexity of the Arabic language and the prevalence of isolated sign language datasets that concentrate on individual words instead of continuous speech contribute to this issue. To address this gap, our research represents an important step in developing SSL resources. To address this, we introduce the first continuous Saudi Sign Language dataset called KAU-CSSL, focusing on complete sentences to facilitate further research and enable sophisticated recognition systems for SSL recognition and translation. Additionally, we propose a transformer-based model, utilizing a pretrained ResNet-18 for spatial feature extraction and a Transformer Encoder with Bidirectional LSTM for temporal dependencies, achieving 99.02\% accuracy at signer dependent mode and 77.71\% accuracy at signer independent mode. This development leads the way to not only improving communication tools for the SSL community but also making a substantial contribution to the wider field of sign language.
- Abstract(参考訳): 手話(SL)は、聴覚障害者や聴覚障害者にとって不可欠なコミュニケーション形態であり、より広い社会内での関わりを可能にする。
特にサウジアラビアでは、84,000人以上の個人がサウジアラビア手話(SSL)を主要なコミュニケーション形態としている。
特定の技術的アプローチは聴覚障害のある個人のコミュニケーションを改善するのに役立っているが、より正確で信頼性の高い翻訳技術、特にSSLのようなアラビア語の手話の変種には、依然として緊急の要件がある。
ほとんどの最先端のソリューションは、主にアラビア語以外の手話に焦点を合わせており、その結果、アラビア語手話、特にSSLに特化したリソースが欠如している。
アラビア語の複雑さと、連続的な発話ではなく個々の単語に集中する独立した手話データセットの出現は、この問題に寄与する。
このギャップに対処するため、われわれの研究はSSLリソースの開発における重要なステップである。
これを解決するために、我々はKAU-CSSLと呼ばれる最初の連続サウジアラビア手話データセットを導入し、さらなる研究を容易にし、SSL認識と翻訳のための高度な認識システムを実現するための完全な文に焦点を当てた。
さらに、空間的特徴抽出のためのResNet-18と、時間依存のための双方向LSTMを用いたトランスフォーマーエンコーダを用いて、シグナ依存モードでの99.02\%、シグナ依存モードでの77.71\%の精度を実現するトランスフォーマモデルを提案する。
この開発によって、SSLコミュニティのコミュニケーションツールの改善だけでなく、手話の広い分野にも大きな貢献をするようになる。
関連論文リスト
- Real-time Sign Language Recognition Using MobileNetV2 and Transfer Learning [0.0]
ISL信号を音声やテキストに変換するための効率的な技術はまだ存在しない。
我々のゴールは、畳み込みニューラルネットワーク(CNN)の助けを借りて、信頼できる手話認識システムを構築することである。
論文 参考訳(メタデータ) (2024-12-10T13:08:16Z) - Enhanced Sign Language Translation between American Sign Language (ASL) and Indian Sign Language (ISL) Using LLMs [0.2678472239880052]
我々は、アメリカ手話の利用者と話し言葉とインド手話(ISL)の利用者の間に橋渡しを提供することを目標とする研究を思いついた。
このフレームワークは、ジェスチャーの可変性の自動処理や、ASLとISLの言語的違いを克服するといった重要な課題に対処する。
論文 参考訳(メタデータ) (2024-11-19T17:45:12Z) - The American Sign Language Knowledge Graph: Infusing ASL Models with Linguistic Knowledge [6.481946043182915]
専門的な言語知識の12つの情報源からコンパイルされたASLKG(American Sign Language Knowledge Graph)を紹介する。
我々は、ASLKGを用いて、3つのASL理解タスクのニューロシンボリックモデルをトレーニングし、ISRで91%のアキュラシーを達成し、14%の未確認のサインのセマンティックな特徴を予測し、36%のYoutube-ASLビデオのトピックを分類した。
論文 参考訳(メタデータ) (2024-11-06T00:16:16Z) - Scaling up Multimodal Pre-training for Sign Language Understanding [96.17753464544604]
手話は、難聴者コミュニティにとってコミュニケーションの主要な意味である。
難聴者と聴覚者のコミュニケーションを容易にするために,手話理解(SLU)タスクのシリーズが研究されている。
これらの課題は、多様な視点から手話のトピックを調査し、手話ビデオの効果的な表現を学ぶ上での課題を提起する。
論文 参考訳(メタデータ) (2024-08-16T06:04:25Z) - The Sem-Lex Benchmark: Modeling ASL Signs and Their Phonemes [6.0179345110920455]
本稿では,ASL(American Sign Language)モデリングのための新しいリソースであるSem-Lex Benchmarkを紹介する。
Benchmarkは、現在最大規模で、聴覚障害のASL署名者による84万本以上の単独のサイン制作のビデオで構成されており、インフォームド・コンセントが与えられ、補償を受けた。
ASL-LEXにおける言語情報を活用する一連の実験を行い、Sem-Lex Benchmark(ISR)の実用性と公正性を評価した。
論文 参考訳(メタデータ) (2023-09-30T00:25:43Z) - LSA-T: The first continuous Argentinian Sign Language dataset for Sign
Language Translation [52.87578398308052]
手話翻訳(SLT)は、人間とコンピュータの相互作用、コンピュータビジョン、自然言語処理、機械学習を含む活発な研究分野である。
本稿では,最初の連続的アルゼンチン手話(LSA)データセットを提案する。
このビデオには、CN Sordos YouTubeチャンネルから抽出されたLCAの14,880の文レベルのビデオと、各署名者のためのラベルとキーポイントアノテーションが含まれている。
論文 参考訳(メタデータ) (2022-11-14T14:46:44Z) - Audio Self-supervised Learning: A Survey [60.41768569891083]
SSL(Self-Supervised Learning)は、人間のアノテーションを必要とせずに、大規模データから一般的な表現を見つけることを目的としている。
コンピュータビジョンと自然言語処理の分野での成功により、近年では音声処理や音声処理の分野で採用されている。
論文 参考訳(メタデータ) (2022-03-02T15:58:29Z) - ASL-Skeleton3D and ASL-Phono: Two Novel Datasets for the American Sign
Language [3.974836127188525]
手話認識分野は、ユーザと手話の非ユーザの間のギャップを埋めることを目的としている。
本稿では,アメリカ手話のための2つの新しいデータセットを導入することで貢献する。
論文 参考訳(メタデータ) (2022-01-06T14:10:03Z) - All You Need In Sign Language Production [50.3955314892191]
言語認識と生産のサインは、いくつかの重要な課題に対処する必要があります。
本稿では,難聴文化,難聴センター,手話の心理的視点について紹介する。
また、SLPのバックボーンアーキテクチャや手法を簡潔に紹介し、SLPの分類について提案する。
論文 参考訳(メタデータ) (2022-01-05T13:45:09Z) - Sign Language Production: A Review [51.07720650677784]
手話 (Sign Language) は、聴覚障害と聴覚障害のコミュニティで使われるコミュニケーション言語である。
聴覚障害者と聴覚コミュニティのコミュニケーションを容易かつ相互に行うためには、話し言葉を手話に翻訳できる堅牢なシステムを構築することが不可欠です。
そのために、手話認識と生産は、このような双方向システムを作るのに必要な2つの部分です。
論文 参考訳(メタデータ) (2021-03-29T19:38:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。