論文の概要: ArEEG_Words: Dataset for Envisioned Speech Recognition using EEG for Arabic Words
- arxiv url: http://arxiv.org/abs/2411.18888v1
- Date: Thu, 28 Nov 2024 03:31:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:23:14.439846
- Title: ArEEG_Words: Dataset for Envisioned Speech Recognition using EEG for Arabic Words
- Title(参考訳): ArEEG_Words: アラビア語における脳波を用いた音声認識のためのデータセット
- Authors: Hazem Darwish, Abdalrahman Al Malah, Khloud Al Jallad, Nada Ghneim,
- Abstract要約: 本稿では,22歳以上の被験者から得られた新しい脳波データであるArEEG_Wordsデータセットを紹介する。
合計352個の脳波記録が収集され、各記録は複数の250ms信号に分割され、合計15,360個の脳波信号が得られた。
私たちの知る限りでは、ArEEG_WordsデータはアラビアのEEGドメインで最初のデータです。
- 参考スコア(独自算出の注目度): 0.6749750044497731
- License:
- Abstract: Brain-Computer-Interface (BCI) aims to support communication-impaired patients by translating neural signals into speech. A notable research topic in BCI involves Electroencephalography (EEG) signals that measure the electrical activity in the brain. While significant advancements have been made in BCI EEG research, a major limitation still exists: the scarcity of publicly available EEG datasets for non-English languages, such as Arabic. To address this gap, we introduce in this paper ArEEG_Words dataset, a novel EEG dataset recorded from 22 participants with mean age of 22 years (5 female, 17 male) using a 14-channel Emotiv Epoc X device. The participants were asked to be free from any effects on their nervous system, such as coffee, alcohol, cigarettes, and so 8 hours before recording. They were asked to stay calm in a clam room during imagining one of the 16 Arabic Words for 10 seconds. The words include 16 commonly used words such as up, down, left, and right. A total of 352 EEG recordings were collected, then each recording was divided into multiple 250ms signals, resulting in a total of 15,360 EEG signals. To the best of our knowledge, ArEEG_Words data is the first of its kind in Arabic EEG domain. Moreover, it is publicly available for researchers as we hope that will fill the gap in Arabic EEG research.
- Abstract(参考訳): Brain-Computer-Interface (BCI)は、神経信号を音声に翻訳することで、コミュニケーション障害のある患者を支援することを目的としている。
BCIにおける注目すべき研究トピックは、脳波(EEG)信号が脳内の電気活動を測定することである。
BCIのEEG研究で顕著な進歩があったが、大きな制限が残っている: アラビア語のような非英語の言語で公開されているEEGデータセットが不足している。
このギャップに対処するために、14チャンネルのEmotiv Epoc Xデバイスを用いて、22歳(女性5人、男性17人)の被験者から記録された新しい脳波データセットであるArEEG_Wordsデータセットを紹介した。
参加者は、コーヒー、アルコール、タバコなど、神経系にどんな影響も与えないよう求められました。
彼らは、アラビア語16語のうちの1つを10秒間想像しながら、クレムの部屋で落ち着くように頼まれた。
語は上・下・左・右の16語が一般的である。
合計352個の脳波記録が収集され、各記録は複数の250ms信号に分割され、合計15,360個の脳波信号が得られた。
私たちの知る限りでは、ArEEG_WordsデータはアラビアのEEGドメインで最初のデータです。
さらに、アラビア語の脳波研究のギャップを埋めることを期待して、研究者に公開されています。
関連論文リスト
- EEG2TEXT: Open Vocabulary EEG-to-Text Decoding with EEG Pre-Training and Multi-View Transformer [4.863362296028391]
本稿では,脳波からテキストへのデコーディングの精度を向上させる新しい手法を提案する。
EEG2 TEXTUREは、コミュニケーションを容易にするための高性能なオープン語彙脳-テキストシステムの可能性を示している。
論文 参考訳(メタデータ) (2024-05-03T15:14:19Z) - Enhancing EEG-to-Text Decoding through Transferable Representations from Pre-trained Contrastive EEG-Text Masked Autoencoder [69.7813498468116]
コントラスト型脳波テキストマスケード自動エンコーダ(CET-MAE)を提案する。
また、E2T-PTR(Pretrained Transferable Representationsを用いたEEG-to-Text decoding)と呼ばれるフレームワークを開発し、EEGシーケンスからテキストをデコードする。
論文 参考訳(メタデータ) (2024-02-27T11:45:21Z) - ArEEG_Chars: Dataset for Envisioned Speech Recognition using EEG for Arabic Characters [0.6749750044497731]
現在、アラビア文字のEEG信号のためのEEGデータセットは公開されていない。
ArEEG_Charsは、30人の参加者から収集されたアラビア語31文字のための新しいEEGデータセットである。
本研究で収集した脳波信号の総計は39857である。
論文 参考訳(メタデータ) (2024-02-24T06:05:15Z) - Decoding speech perception from non-invasive brain recordings [48.46819575538446]
非侵襲的な記録から知覚音声の自己教師付き表現をデコードするために、コントラスト学習で訓練されたモデルを導入する。
我々のモデルでは、3秒のMEG信号から、1,000以上の異なる可能性から最大41%の精度で対応する音声セグメントを識別できる。
論文 参考訳(メタデータ) (2022-08-25T10:01:43Z) - Exploiting Cross-domain And Cross-Lingual Ultrasound Tongue Imaging
Features For Elderly And Dysarthric Speech Recognition [55.25565305101314]
調音機能は音響信号歪みに不変であり、音声認識システムにうまく組み込まれている。
本稿では,A2Aモデルにおける24時間TaLコーパスの並列音声・超音波舌画像(UTI)データを利用したクロスドメインおよびクロスランガルA2Aインバージョン手法を提案する。
生成した調音機能を組み込んだ3つのタスクの実験は、ベースラインのTDNNとコンフォーマーASRシステムより一貫して優れていた。
論文 参考訳(メタデータ) (2022-06-15T07:20:28Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - DAL: Feature Learning from Overt Speech to Decode Imagined Speech-based
EEG Signals with Convolutional Autoencoder [24.63367043284252]
本研究は,音声による脳波信号を自動エンコーダで復号化するために,音声の脳波特徴を用いた最初の試みである。
4つの単語を分類すると、DALの平均精度は48.41%だった。
w/oとw/EEGの特徴を比較すると、過剰音声の脳波の特徴を含む場合のパフォーマンスは7.42%向上した。
論文 参考訳(メタデータ) (2021-07-15T01:13:19Z) - Emotional Voice Conversion: Theory, Databases and ESD [84.62083515557886]
新たな感情音声データベース(ESD)の開発をモチベーションとする。
ESDデータベースは、10人のネイティブイングリッシュと10人のネイティブ中国語話者によって話される350のパラレル発話で構成されている。
本データベースは,多言語・多言語間音声変換研究に適したデータベースである。
論文 参考訳(メタデータ) (2021-05-31T07:48:56Z) - Analysis of artifacts in EEG signals for building BCIs [0.42641920138420947]
脳コンピュータインタフェース(BCI)は、人間の脳の信号を解釈する重要なメカニズムである。
脳波信号は、眼の瞬き、頭部の動き、顎の動きなど、多くの人工物が存在するためうるさい。
本稿では,低信号対雑音比の人工物を用いた実用的なBCIを提案する。
論文 参考訳(メタデータ) (2020-09-18T23:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。