論文の概要: ArEEG_Chars: Dataset for Envisioned Speech Recognition using EEG for Arabic Characters
- arxiv url: http://arxiv.org/abs/2402.15733v3
- Date: Sun, 03 Nov 2024 05:00:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:41:47.524568
- Title: ArEEG_Chars: Dataset for Envisioned Speech Recognition using EEG for Arabic Characters
- Title(参考訳): ArEEG_Chars: アラビア文字の脳波を用いた音声認識のためのデータセット
- Authors: Hazem Darwish, Abdalrahman Al Malah, Khloud Al Jallad, Nada Ghneim,
- Abstract要約: 現在、アラビア文字のEEG信号のためのEEGデータセットは公開されていない。
ArEEG_Charsは、30人の参加者から収集されたアラビア語31文字のための新しいEEGデータセットである。
本研究で収集した脳波信号の総計は39857である。
- 参考スコア(独自算出の注目度): 0.6749750044497731
- License:
- Abstract: Brain-computer interfaces is an important and hot research topic that revolutionize how people interact with the world, especially for individuals with neurological disorders. While extensive research has been done in EEG signals of English letters and words, a major limitation remains: the lack of publicly available EEG datasets for many non-English languages, such as Arabic. Although Arabic is one of the most spoken languages worldwide, to the best of our knowledge, there is no publicly available dataset for EEG signals of Arabic characters until now. To address this gap, we introduce ArEEG_Chars, a novel EEG dataset for Arabic 31 characters collected from 30 participants (21 males and 9 females), these records were collected using Epoc X 14 channels device for 10 seconds long for each char record. The number of recorded signals were 930 EEG recordings. To make the EEG signals suitable for analyzing, each recording has been split into multiple signals with a time duration of 250ms, respectively. Therefore, a total of 39857 recordings of EEG signals have been collected in this study. Moreover, ArEEG_Chars will be publicly available for researchers. We do hope that this dataset will fill an important gap in the research of Arabic EEG benefiting Arabic-speaking individuals with disabilities.
- Abstract(参考訳): 脳-コンピュータインターフェースは、特に神経疾患を持つ人に対する人々の世界との相互作用に革命をもたらす、重要かつホットな研究トピックである。
英語の文字や単語の脳波信号で広範な研究が行われてきたが、大きな制限が残っている。
アラビア語は世界で最も話されている言語のひとつですが、私たちの知る限りでは、現在までアラビア語文字の脳波信号のデータセットは公開されていません。
AEEG_Charsは30名(男性21名,女性9名)から収集したアラビア語31文字を対象とした新しい脳波データセットであり,Epoc X 14チャネル装置を用いて収集した。
記録された信号の数は930のEEG記録であった。
脳波信号を解析するのに適当にするために、各記録をそれぞれ250msの時間で複数の信号に分割した。
そこで本研究では,計39857個の脳波信号が収集されている。
さらに、ArEEG_Charsは研究者向けに公開されている。
このデータセットが、障害のあるアラビア語話者に利益をもたらすアラビア脳波の研究において、重要なギャップを埋めることを期待しています。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - EgyBERT: A Large Language Model Pretrained on Egyptian Dialect Corpora [0.0]
本研究は、エジプト方言の10.4GBのテキストで事前訓練されたアラビア語の言語モデルであるEgyBERTを提示する。
EgyBERTは平均F1スコア84.25%、精度87.33%を達成した。
本研究はエジプトの方言データセット上での各種言語モデルの性能を評価する最初の研究である。
論文 参考訳(メタデータ) (2024-08-07T03:23:55Z) - An open dataset for oracle bone script recognition and decipherment [66.35957530824872]
古代中国最古の書体の一つ、Oracleの骨書は、3000年前にさかのぼる上海王朝の人文・地理を研究する学者にとって、貴重な研究資料を提示している。
時間の経過はそれらの意味の多くを曖昧にしており、これらの古代のテキストを解読する上で重要な課題が提示されている。
人工知能(AI)の出現により、Oracle Bone Characters(OBC)の解読を支援するAIが実現可能な選択肢となっている。
このデータセットは1,588個の解読文字の77,064個の画像と9,411個の未解読文字の62,989個の画像を含む。
論文 参考訳(メタデータ) (2024-01-27T09:54:16Z) - Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。
データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文 参考訳(メタデータ) (2023-05-23T21:00:42Z) - ArabSign: A Multi-modality Dataset and Benchmark for Continuous Arabic
Sign Language Recognition [1.2691047660244335]
ArabSignデータセットは、6人の署名者が実行した9,335のサンプルで構成されている。
記録された文の総時間はおよそ10時間であり、平均的な文の長さは3.1の記号である。
連続型ArSL認識のためのエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2022-10-08T07:36:20Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Gesture based Arabic Sign Language Recognition for Impaired People based
on Convolution Neural Network [0.0]
アラビア手話(ArSL)の認識は、アラビア手話(ArSL)のバリエーションにより難しい研究課題となっている。
提案システムは、アラビア手話の手振りを入力とし、発声音声を出力する。
結果は90%の人に認識された。
論文 参考訳(メタデータ) (2022-03-10T19:36:04Z) - ASMDD: Arabic Speech Mispronunciation Detection Dataset [0.0]
このデータセットは、アラビア語でよく使われる上位100語を表す注釈付きオーディオファイルで構成されている。
データセットは、専門家リスナーによるセグメント発音誤り検出に基づいて収集、注釈付けされる。
論文 参考訳(メタデータ) (2021-11-01T16:50:07Z) - New Arabic Medical Dataset for Diseases Classification [55.41644538483948]
いくつかのアラブの医療ウェブサイトから収集された2000の医療資料を含む、アラブの医療データセットを新たに導入する。
データセットはテキストの分類作業のために構築され、10つのクラス(Blood, Bone, Cardiovascular, Ear, Endocrine, Eye, Gastrointestinal, Immune, Liver, Nephrological)を含んでいる。
データセットの実験は、GoogleのBERT、大きなアラビアのコーパスを持つBERTに基づくアラビアト、アラビアの医療コーパスをベースとしたAraBioNERの3つの事前トレーニングモデルによって行われた。
論文 参考訳(メタデータ) (2021-06-29T10:42:53Z) - Decoding EEG Brain Activity for Multi-Modal Natural Language Processing [9.35961671939495]
自然言語処理タスクを改善するために脳波脳活動データの可能性を体系的に分析する最初の大規模研究を行った。
脳波信号を周波数帯域にフィルタリングすることはブロードバンド信号よりも有益であることがわかった。
単語埋め込みタイプの範囲のために、EEGデータは二分および三分感情の分類を改善し、複数のベースラインを上回ります。
論文 参考訳(メタデータ) (2021-02-17T09:44:21Z) - Arabic Speech Recognition by End-to-End, Modular Systems and Human [56.96327247226586]
我々は、エンドツーエンド変換器ASR、モジュール型HMM-DNN ASR、および人間の音声認識のための包括的なベンチマークを行う。
ASRでは、エンドツーエンドの作業が12.5%、27.5%、23.8%のWERとなり、それぞれMGB2、MGB3、MGB5の新たなパフォーマンスマイルストーンとなった。
以上の結果から,アラビア語における人的パフォーマンスは,平均3.6%のWERギャップを持つ機械に比べて,依然としてかなり優れていたことが示唆された。
論文 参考訳(メタデータ) (2021-01-21T05:55:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。