論文の概要: DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection
- arxiv url: http://arxiv.org/abs/2410.11181v2
- Date: Mon, 18 Nov 2024 16:25:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:30:07.568790
- Title: DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection
- Title(参考訳): DARNet:聴覚注意検出のための時空間構成付きデュアルアテンションリファインメントネットワーク
- Authors: Sheng Yan, Cunhang fan, Hongyu Zhang, Xiaoke Yang, Jianhua Tao, Zhao Lv,
- Abstract要約: 聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。
これらの課題に対処するために,DARNet 構築モジュール,デュアルアテンション改善モジュール,機能融合時・モジュールからなる DARNet を提案する。
実験の結果,DARNetは最先端モデルと比較して平均分類精度が0.1sで5.9%,1sで4.6%,DTUデータセットで2sで3.9%向上していることがわかった。
- 参考スコア(独自算出の注目度): 34.439481691814706
- License:
- Abstract: At a cocktail party, humans exhibit an impressive ability to direct their attention. The auditory attention detection (AAD) approach seeks to identify the attended speaker by analyzing brain signals, such as EEG signals. However, current AAD algorithms overlook the spatial distribution information within EEG signals and lack the ability to capture long-range latent dependencies, limiting the model's ability to decode brain activity. To address these issues, this paper proposes a dual attention refinement network with spatiotemporal construction for AAD, named DARNet, which consists of the spatiotemporal construction module, dual attention refinement module, and feature fusion \& classifier module. Specifically, the spatiotemporal construction module aims to construct more expressive spatiotemporal feature representations, by capturing the spatial distribution characteristics of EEG signals. The dual attention refinement module aims to extract different levels of temporal patterns in EEG signals and enhance the model's ability to capture long-range latent dependencies. The feature fusion \& classifier module aims to aggregate temporal patterns and dependencies from different levels and obtain the final classification results. The experimental results indicate that compared to the state-of-the-art models, DARNet achieves an average classification accuracy improvement of 5.9\% for 0.1s, 4.6\% for 1s, and 3.9\% for 2s on the DTU dataset. While maintaining excellent classification performance, DARNet significantly reduces the number of required parameters. Compared to the state-of-the-art models, DARNet reduces the parameter count by 91\%. Code is available at: https://github.com/fchest/DARNet.git.
- Abstract(参考訳): カクテルパーティーでは、人間は注意を向ける印象的な能力を示します。
聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。
しかし、現在のAADアルゴリズムは、脳波信号内の空間分布情報を見落とし、長期の潜伏依存性をキャプチャする能力がなく、モデルの脳活動の復号化能力を制限している。
そこで本稿では, 時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDAR, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNetを提案する。
具体的には,脳波信号の空間分布特性を捉えることで,より表現力の高い時空間特徴表現を構築することを目的としている。
デュアルアテンションリファインメントモジュールは、脳波信号の時間パターンの異なるレベルを抽出し、長期の潜伏依存関係をキャプチャするモデルの能力を高めることを目的としている。
Feature fusion \& Classifierモジュールは、時間的パターンと依存関係を異なるレベルから集約し、最終的な分類結果を得ることを目的としている。
実験の結果,DARNetは最先端モデルと比較して,0.1sでは5.9\%,1sでは4.6\%,DTUデータセットでは2sでは3.9\%の平均分類精度の向上を達成した。
優れた分類性能を維持しながら、DARNetは必要なパラメータの数を大幅に削減する。
最先端モデルと比較して、DARNetはパラメータの数を91\%削減する。
コードは、https://github.com/fchest/DARNet.git.comで入手できる。
関連論文リスト
- IRASNet: Improved Feature-Level Clutter Reduction for Domain Generalized SAR-ATR [11.197991954581155]
本研究ではIRASNetと呼ばれるドメイン一般化SAR-ATRのためのフレームワークを提案する。
IRASNetは効果的な機能レベルのクラッタ削減とドメイン不変の機能学習を可能にする。
IRASNetは、性能を向上するだけでなく、特徴レベルのクラッタ低減を大幅に改善し、レーダ画像パターン認識の分野での貴重な進歩となる。
論文 参考訳(メタデータ) (2024-09-25T11:53:58Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of
Multiclass Defect Segmentation [1.487252325779766]
提案アーキテクチャであるDual Attentive U-Net with Feature Infusion (DAU-FI Net)はセマンティックセグメンテーションにおける課題に対処する。
DAU-FI Netは、複数スケールの空間チャネルアテンション機構と特徴注入を統合し、オブジェクトのローカライゼーションの精度を高める。
挑戦的な下水道管と、欠陥データセットと、DAU-FI Netの能力を検証したベンチマークデータセットに関する総合的な実験。
論文 参考訳(メタデータ) (2023-12-21T17:23:49Z) - TWR-MCAE: A Data Augmentation Method for Through-the-Wall Radar Human
Motion Recognition [19.7631142728486]
本稿では,マルチリンク自動符号化ニューラルネットワーク(TWR-MCAE)データ拡張手法を提案する。
提案アルゴリズムは、より優れたピーク信号-雑音比(PSNR)を得る。
実験により,提案アルゴリズムはより優れたピーク信号対雑音比(PSNR)が得られることが示された。
論文 参考訳(メタデータ) (2023-01-06T12:56:53Z) - Leveraging Spatio-Temporal Dependency for Skeleton-Based Action
Recognition [9.999149887494646]
骨格をベースとした行動認識は、人体の骨格縫合のコンパクトな表現により、かなりの注目を集めている。
グラフ畳み込みニューラルネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を用いた最近の多くの手法が目覚ましい性能を実現している。
論文 参考訳(メタデータ) (2022-12-09T10:37:22Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Motor Imagery Classification based on CNN-GRU Network with
Spatio-Temporal Feature Representation [22.488536453952964]
近年、脳波(EEG)信号に様々なディープニューラルネットワークが応用されている。
脳波は非侵襲的に取得できる脳信号であり、時間分解能が高い。
脳波信号は高次元の分類特徴空間を持つため,性能向上には適切な特徴抽出法が必要である。
論文 参考訳(メタデータ) (2021-07-15T01:05:38Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。