論文の概要: Post-processing of EEG-based Auditory Attention Decoding Decisions via Hidden Markov Models
- arxiv url: http://arxiv.org/abs/2506.24024v1
- Date: Mon, 30 Jun 2025 16:31:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:54.156163
- Title: Post-processing of EEG-based Auditory Attention Decoding Decisions via Hidden Markov Models
- Title(参考訳): 隠れマルコフモデルによる脳波に基づく聴覚注意決定の事後処理
- Authors: Nicolas Heintz, Tom Francart, Alexander Bertrand,
- Abstract要約: 脳波(EEG)などの脳信号を利用した聴覚注意復号法(AAD)アルゴリズム
注意の時間構造をモデル化した隠れマルコフモデル(HMM)によるAADの拡張を提案する。
HMMは、因果(リアルタイム)と非因果(オフライン)の両方の設定において、既存のAADアルゴリズムを大幅に改善できることを示す。
- 参考スコア(独自算出の注目度): 48.164830545588785
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Auditory attention decoding (AAD) algorithms exploit brain signals, such as electroencephalography (EEG), to identify which speaker a listener is focusing on in a multi-speaker environment. While state-of-the-art AAD algorithms can identify the attended speaker on short time windows, their predictions are often too inaccurate for practical use. In this work, we propose augmenting AAD with a hidden Markov model (HMM) that models the temporal structure of attention. More specifically, the HMM relies on the fact that a subject is much less likely to switch attention than to keep attending the same speaker at any moment in time. We show how a HMM can significantly improve existing AAD algorithms in both causal (real-time) and non-causal (offline) settings. We further demonstrate that HMMs outperform existing postprocessing approaches in both accuracy and responsiveness, and explore how various factors such as window length, switching frequency, and AAD accuracy influence overall performance. The proposed method is computationally efficient, intuitive to use and applicable in both real-time and offline settings.
- Abstract(参考訳): 聴覚アテンションデコーディング(AAD)アルゴリズムは脳波(EEG)などの脳信号を利用して、リスナーがマルチスピーカー環境でどの話者に焦点を当てているかを特定する。
最先端のAADアルゴリズムは、短い時間帯の話者を識別できるが、それらの予測は実用には不正確すぎることが多い。
本研究では,注意の時間構造をモデル化した隠れマルコフモデル(HMM)によるAADの拡張を提案する。
より具体的には、HMMは、被験者がどの時点でも同じ話者に通い続けるよりも、注意を切り替える可能性がはるかに低いという事実に依存している。
HMMは、因果(リアルタイム)と非因果(オフライン)の両方の設定において、既存のAADアルゴリズムを大幅に改善できることを示す。
さらに、HMMは、既存のポストプロセッシング手法よりも精度と応答性に優れており、ウィンドウ長、切替周波数、AAD精度といった様々な要因が全体的な性能に与える影響について検討する。
提案手法は計算効率が高く,直感的に使用でき,リアルタイム設定とオフライン設定の両方に適用可能である。
関連論文リスト
- From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms [6.643376250301589]
我々は、オーディオ異常検出(AAD)の問題に対処するために、そのようなアルゴリズムのオーディオ領域への適応について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内における異常の微細な時間周波数局在を導入している。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-25T16:22:42Z) - AADNet: Exploring EEG Spatiotemporal Information for Fast and Accurate Orientation and Timbre Detection of Auditory Attention Based on A Cue-Masked Paradigm [4.479495549911642]
脳波(EEG)からの聴覚的注意復号は、ユーザがノイズの多い環境でどのソースに出席しているかを推測することができる。
本研究は,実験前の情報漏洩を回避するために,キューメイドの聴覚注意パラダイムを提案する。
短時間の脳波信号から時間情報を活用するために,エンドツーエンドのディープラーニングモデルであるAADNetを提案した。
論文 参考訳(メタデータ) (2025-01-07T06:51:17Z) - What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.063161380423715]
既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:52:17Z) - Brain-Driven Representation Learning Based on Diffusion Model [25.375490061512]
本研究では,拡散確率モデル(DDPM)について検討した。
条件付きオートエンコーダとDDPMを併用することで、我々の新しいアプローチは従来の機械学習アルゴリズムよりもかなり優れています。
本研究は,音声関連脳波信号解析のための高度な計算手法として,DDPMの可能性を強調した。
論文 参考訳(メタデータ) (2023-11-14T05:59:58Z) - IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing [88.35145788575348]
画像異常検出(英: Image Anomaly Detection、IAD)は、産業用コンピュータビジョンの課題である。
統一IMベンチマークの欠如は、現実世界のアプリケーションにおけるIADメソッドの開発と利用を妨げる。
7つの主要なデータセットに19のアルゴリズムを含む包括的画像異常検出ベンチマーク(IM-IAD)を構築した。
論文 参考訳(メタデータ) (2023-01-31T01:24:45Z) - Dissecting User-Perceived Latency of On-Device E2E Speech Recognition [34.645194215436966]
我々は,トークン放出遅延とエンドポイント動作に影響を与える要因がユーザ知覚遅延(upl)に大きく影響することを示す。
我々は,最近提案されたアライメント正規化を用いて,ASRとエンドポイントを併用する際のレイテンシと単語エラー率の最良のトレードオフを実現する。
論文 参考訳(メタデータ) (2021-04-06T00:55:11Z) - Switching Variational Auto-Encoders for Noise-Agnostic Audio-visual
Speech Enhancement [26.596930749375474]
本稿では,異なるVAEアーキテクチャを時間的に切り換えるために,マルコフの依存関係を持つ潜在逐次変数を導入する。
モデルのパラメータを推定し、音声信号を強化するために、対応する変動予測-最大化アルゴリズムを導出する。
論文 参考訳(メタデータ) (2021-02-08T11:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。