論文の概要: TAnet: A New Temporal Attention Network for EEG-based Auditory Spatial
Attention Decoding with a Short Decision Window
- arxiv url: http://arxiv.org/abs/2401.05819v1
- Date: Thu, 11 Jan 2024 10:36:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 15:16:31.781285
- Title: TAnet: A New Temporal Attention Network for EEG-based Auditory Spatial
Attention Decoding with a Short Decision Window
- Title(参考訳): tanet : 短い決定窓を持つ脳波に基づく聴覚空間注意デコードのための新しい時間的注意ネットワーク
- Authors: Yuting Ding, Fei Chen
- Abstract要約: 聴取者の話者に対する注意方向を決定するために、聴覚空間注意検出(ASAD)を用いる。
本研究では、終端から終端までの時間的注意ネットワーク(TAnet)が導入された。
- 参考スコア(独自算出の注目度): 3.4299610499501387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auditory spatial attention detection (ASAD) is used to determine the
direction of a listener's attention to a speaker by analyzing her/his
electroencephalographic (EEG) signals. This study aimed to further improve the
performance of ASAD with a short decision window (i.e., <1 s) rather than with
long decision windows in previous studies. An end-to-end temporal attention
network (i.e., TAnet) was introduced in this work. TAnet employs a multi-head
attention (MHA) mechanism, which can more effectively capture the interactions
among time steps in collected EEG signals and efficiently assign corresponding
weights to those EEG time steps. Experiments demonstrated that, compared with
the CNN-based method and recent ASAD methods, TAnet provided improved decoding
performance in the KUL dataset, with decoding accuracies of 92.4% (decision
window 0.1 s), 94.9% (0.25 s), 95.1% (0.3 s), 95.4% (0.4 s), and 95.5% (0.5 s)
with short decision windows (i.e., <1 s). As a new ASAD model with a short
decision window, TAnet can potentially facilitate the design of EEG-controlled
intelligent hearing aids and sound recognition systems.
- Abstract(参考訳): 聴覚空間注意検出(ASAD)は、脳波(EEG)信号を解析することにより、聴取者の話者に対する注意方向を決定するために用いられる。
本研究は,asadの性能をさらに向上させることを目的としており,これまでの研究では,長い決定窓ではなく,短い決定窓 (<1s) を用いた。
本研究では、終端から終端までの時間的注意ネットワーク(TAnet)が導入された。
TAnetはマルチヘッドアテンション(MHA)機構を採用しており、収集されたEEG信号の時間ステップ間の相互作用をより効果的に捉え、対応する重みをこれらのEEG時間ステップに効率的に割り当てることができる。
CNN法や最近のASAD法と比較して、TAnetは92.4% (決定窓0.1 s)、94.9% (0.25 s)、95.1% (0.3 s)、95.4% (0.4 s)、95.5% (0.5 s)の短い決定窓(すなわち <1 s)で、KULデータセットの復号性能を改善した。
短い決定窓を持つ新しいasadモデルとして、tanetは脳波制御された知的補聴器と音響認識システムの設計を容易にする可能性がある。
関連論文リスト
- AI-in-the-Loop Sensing and Communication Joint Design for Edge Intelligence [65.29835430845893]
本稿では,AI-in-the-loopジョイントセンシングと通信によるエッジインテリジェンス向上のためのフレームワークを提案する。
私たちの研究の重要な貢献は、バリデーション損失とシステムのチューニング可能なパラメータとの間に明確な関係を確立することです。
提案手法は, 通信エネルギー消費を最大77%削減し, 試料数で測定した検知コストを最大52%削減する。
論文 参考訳(メタデータ) (2025-02-14T14:56:58Z) - CEReBrO: Compact Encoder for Representations of Brain Oscillations Using Efficient Alternating Attention [53.539020807256904]
交互注意(CEReBrO)を用いた脳振動の表現のための圧縮法について紹介する。
トークン化方式は、チャネルごとのパッチで脳波信号を表現します。
本研究では,チャネル内時間的ダイナミックスとチャネル間空間的相関を共同でモデル化し,通常の自己アテンションに比べて6倍少ないメモリで2倍の速度向上を実現するための注意機構を提案する。
論文 参考訳(メタデータ) (2025-01-18T21:44:38Z) - AADNet: Exploring EEG Spatiotemporal Information for Fast and Accurate Orientation and Timbre Detection of Auditory Attention Based on A Cue-Masked Paradigm [4.479495549911642]
脳波(EEG)からの聴覚的注意復号は、ユーザがノイズの多い環境でどのソースに出席しているかを推測することができる。
本研究は,実験前の情報漏洩を回避するために,キューメイドの聴覚注意パラダイムを提案する。
短時間の脳波信号から時間情報を活用するために,エンドツーエンドのディープラーニングモデルであるAADNetを提案した。
論文 参考訳(メタデータ) (2025-01-07T06:51:17Z) - DGSD: Dynamical Graph Self-Distillation for EEG-Based Auditory Spatial
Attention Detection [49.196182908826565]
AAD(Auditory Attention Detection)は、マルチスピーカー環境で脳信号からターゲット話者を検出することを目的としている。
現在のアプローチは主に、画像のようなユークリッドデータを処理するために設計された従来の畳み込みニューラルネットワークに依存している。
本稿では、入力として音声刺激を必要としないAADのための動的グラフ自己蒸留(DGSD)手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T13:43:46Z) - Corticomorphic Hybrid CNN-SNN Architecture for EEG-based Low-footprint
Low-latency Auditory Attention Detection [8.549433398954738]
マルチスピーカー「カクテルパーティー」のシナリオでは、リスナーは興味のある話者に選択的に出席することができる。
ニューラルネットワーク(ANN)を用いた脳波による聴覚的注意検出の最近の動向は,エッジコンピューティングプラットフォームでは実用的ではない。
聴覚野に触発されたハイブリッド畳み込みニューラルネットワーク(CNN-SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:33:39Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - SOUL: An Energy-Efficient Unsupervised Online Learning Seizure Detection
Classifier [68.8204255655161]
神経活動を記録して発作を検出するインプラントデバイスは、発作を抑えるために警告を発したり神経刺激を誘発したりするために採用されている。
移植可能な発作検出システムでは、低出力で最先端のオンライン学習アルゴリズムを使用して、神経信号のドリフトに動的に適応することができる。
SOULはTSMCの28nmプロセスで0.1mm2を占め、1.5nJ/分級エネルギー効率を実現した。
論文 参考訳(メタデータ) (2021-10-01T23:01:20Z) - WNARS: WFST based Non-autoregressive Streaming End-to-End Speech
Recognition [59.975078145303605]
本稿では,ハイブリッドCTC-attention AEDモデルと重み付き有限状態トランスデューサを用いた新しいフレームワークWNARSを提案する。
AISHELL-1タスクでは、640msの遅延で5.22%の文字エラー率を達成し、オンラインASRの最先端のパフォーマンスである私たちの知識を最大限に活用します。
論文 参考訳(メタデータ) (2021-04-08T07:56:03Z) - DENS-ECG: A Deep Learning Approach for ECG Signal Delineation [15.648061765081264]
本稿では,心拍のリアルタイムセグメンテーションのためのディープラーニングモデルを提案する。
提案アルゴリズムはDENS-ECGアルゴリズムと呼ばれ、畳み込みニューラルネットワーク(CNN)と長短期記憶(LSTM)モデルを組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-18T13:13:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。