論文の概要: A New Dataset and Proposed Convolutional Neural Network Architecture for
Classification of American Sign Language Digits
- arxiv url: http://arxiv.org/abs/2011.08927v2
- Date: Tue, 23 Feb 2021 14:28:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-24 23:29:26.101970
- Title: A New Dataset and Proposed Convolutional Neural Network Architecture for
Classification of American Sign Language Digits
- Title(参考訳): アメリカ手話数字の分類のための新しいデータセットと畳み込みニューラルネットワークアーキテクチャの提案
- Authors: Arda Mavi
- Abstract要約: 言語障害のある人々は、手話を知らない他の人とコミュニケーションをとるのに苦労している。
New American Sign Language (ASL) 桁データセットは、機械学習アルゴリズムの作成に役立つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: According to interviews with people who work with speech impaired persons,
speech impaired people have difficulties in communicating with other people
around them who do not know the sign language, and this situation may cause
them to isolate themselves from society and lose their sense of independence.
With this paper, to increase the quality of life of individuals with
facilitating communication between individuals who use sign language and who do
not know this language, a new American Sign Language (ASL) digits dataset that
can help to create machine learning algorithms which need to large and varied
data to be successful created and published as Sign Language Digits Dataset on
Kaggle Datasets web page, a proposal Convolutional Neural Network (CNN)
architecture that can get 98% test accuracy on our dataset presented, and
compared with the existing popular CNN models.
- Abstract(参考訳): 言語障害のある人とのインタビューによると、言語障害のある人は手話を知っている人の周りの人とコミュニケーションが困難であり、この状況により社会から孤立し、自立感を失ってしまう可能性がある。
With this paper, to increase the quality of life of individuals with facilitating communication between individuals who use sign language and who do not know this language, a new American Sign Language (ASL) digits dataset that can help to create machine learning algorithms which need to large and varied data to be successful created and published as Sign Language Digits Dataset on Kaggle Datasets web page, a proposal Convolutional Neural Network (CNN) architecture that can get 98% test accuracy on our dataset presented, and compared with the existing popular CNN models.
関連論文リスト
- ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams [16.172599163455693]
言語や地理的に関連のある言語からの高品質なデータを活用して、ターゲット言語のためのTSを改善する。
第2に,非スタディオ環境で記録された低品質自動音声認識(ASR)データを利用する。
第3に、より堅牢な出力を生成するために、合成データを用いた大規模モデルからの知識蒸留を適用する。
論文 参考訳(メタデータ) (2024-10-23T14:18:25Z) - A Transformer-Based Multi-Stream Approach for Isolated Iranian Sign Language Recognition [0.0]
本研究の目的は,イラン手話語をトランスフォーマーなどの最新のディープラーニングツールの助けを借りて認識することである。
使用されるデータセットには、大学などの学術環境で頻繁に使用されるイラン手話101語が含まれている。
論文 参考訳(メタデータ) (2024-06-27T06:54:25Z) - Multilingual self-supervised speech representations improve the speech
recognition of low-resource African languages with codeswitching [65.74653592668743]
微細な自己教師型多言語表現は絶対単語誤り率を最大20%削減する。
訓練データに制限のある状況では、自己教師付き表現を微調整することが、より良いパフォーマンスと実行可能なソリューションである。
論文 参考訳(メタデータ) (2023-11-25T17:05:21Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - Learning Cross-lingual Visual Speech Representations [108.68531445641769]
言語横断的な自己監督型視覚表現学習は、ここ数年、研究トピックとして成長している。
我々は最近提案したRAVEn(Raw Audio-Visual Speechs)フレームワークを用いて,未ラベルデータを用いた音声-視覚モデルの事前学習を行う。
1)データ量が多いマルチ言語モデルはモノリンガルモデルよりも優れているが、データの量を維持すると、モノリンガルモデルの性能が向上する傾向にある。
論文 参考訳(メタデータ) (2023-03-14T17:05:08Z) - Sign Language to Text Conversion in Real Time using Transfer Learning [0.0]
本稿では,アメリカ手話を用いたディープラーニングモデルを提案する。
精度はCNNの94%から、Transfer Learningによって98.7%に向上した。
論文 参考訳(メタデータ) (2022-11-13T17:20:19Z) - A New 27 Class Sign Language Dataset Collected from 173 Individuals [0.0]
言論不自由な個人の自立感が損なわれ、社会との社交性が低下する可能性がある。
音声障害者のコミュニケーション問題を軽減できる技術開発に寄与するため,本論文では新たなデータセットを提示する。
論文 参考訳(メタデータ) (2022-03-08T05:30:03Z) - Sign Language Recognition System using TensorFlow Object Detection API [0.0]
本稿では,Webカメラを用いてインド手話データセットを作成し,次に移動学習を用いて,リアルタイム手話認識システムを構築するためのモデルを訓練する手法を提案する。
システムは、限られたサイズのデータセットであっても、良好な精度を達成する。
論文 参考訳(メタデータ) (2022-01-05T07:13:03Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - Meta-Transfer Learning for Code-Switched Speech Recognition [72.84247387728999]
低リソース環境下でのコード切替音声認識システムにおける学習を伝達するメタトランスファー学習法を提案する。
本モデルでは,コードスイッチングデータに最適化を条件付けることにより,個々の言語を識別し,混合言語音声をよりよく認識できるように変換する。
論文 参考訳(メタデータ) (2020-04-29T14:27:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。