Fugu-MT 論文翻訳(概要): DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection

論文の概要: DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection

arxiv url: http://arxiv.org/abs/2410.11181v1
Date: Tue, 15 Oct 2024 01:51:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:35.547978
Title: DARNet: Dual Attention Refinement Network with Spatiotemporal Construction for Auditory Attention Detection
Title（参考訳）: DARNet:聴覚注意検出のための時空間構成付きデュアルアテンションリファインメントネットワーク
Authors: Sheng Yan, Cunhang fan, Hongyu Zhang, Xiaoke Yang, Jianhua Tao, Zhao Lv,
Abstract要約: 聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。これらの課題に対処するために,DARNet 構築モジュール,デュアルアテンション改善モジュール,機能融合時・モジュールからなる DARNet を提案する。実験の結果,DARNetは最先端モデルと比較して平均分類精度が0.1sで5.9%,1sで4.6%,DTUデータセットで2sで3.9%向上していることがわかった。
参考スコア（独自算出の注目度）: 34.439481691814706
License: http://creativecommons.org/licenses/by/4.0/
Abstract: At a cocktail party, humans exhibit an impressive ability to direct their attention. The auditory attention detection (AAD) approach seeks to identify the attended speaker by analyzing brain signals, such as EEG signals. However, current AAD algorithms overlook the spatial distribution information within EEG signals and lack the ability to capture long-range latent dependencies, limiting the model's ability to decode brain activity. To address these issues, this paper proposes a dual attention refinement network with spatiotemporal construction for AAD, named DARNet, which consists of the spatiotemporal construction module, dual attention refinement module, and feature fusion \& classifier module. Specifically, the spatiotemporal construction module aims to construct more expressive spatiotemporal feature representations, by capturing the spatial distribution characteristics of EEG signals. The dual attention refinement module aims to extract different levels of temporal patterns in EEG signals and enhance the model's ability to capture long-range latent dependencies. The feature fusion \& classifier module aims to aggregate temporal patterns and dependencies from different levels and obtain the final classification results. The experimental results indicate that compared to the state-of-the-art models, DARNet achieves an average classification accuracy improvement of 5.9\% for 0.1s, 4.6\% for 1s, and 3.9\% for 2s on the DTU dataset. While maintaining excellent classification performance, DARNet significantly reduces the number of required parameters. Compared to the state-of-the-art models, DARNet reduces the parameter count by 91\%. Code is available at: https://github.com/fchest/DARNet.git.
Abstract（参考訳）: カクテルパーティーでは、人間は注意を向ける印象的な能力を示します。聴覚注意検出(AAD)アプローチは、脳波信号などの脳信号を分析して、出席者を特定する。しかし、現在のAADアルゴリズムは、脳波信号内の空間分布情報を見落とし、長期の潜伏依存性をキャプチャする能力がなく、モデルの脳活動の復号化能力を制限している。そこで本稿では, 時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNet, 対時空間構築モジュールDAR, 対時空間構築モジュールDARNet, 対時空間構築モジュールDARNetを提案する。具体的には,脳波信号の空間分布特性を捉えることで,より表現力の高い時空間特徴表現を構築することを目的としている。デュアルアテンションリファインメントモジュールは、脳波信号の時間パターンの異なるレベルを抽出し、長期の潜伏依存関係をキャプチャするモデルの能力を高めることを目的としている。 Feature fusion \& Classifierモジュールは、時間的パターンと依存関係を異なるレベルから集約し、最終的な分類結果を得ることを目的としている。実験の結果,DARNetは最先端モデルと比較して,0.1sでは5.9\%,1sでは4.6\%,DTUデータセットでは2sでは3.9\%の平均分類精度の向上を達成した。優れた分類性能を維持しながら、DARNetは必要なパラメータの数を大幅に削減する。最先端モデルと比較して、DARNetはパラメータの数を91\%削減する。コードは、https://github.com/fchest/DARNet.git.comで入手できる。

関連論文リスト

NeXt2Former-CD: Efficient Remote Sensing Change Detection with Modern Vision Architectures [11.733678383805897]
NeXt2Former-CDは、Siamese ConvNeXtエンコーダとDINOv3重み、変形可能な注目ベースの時間融合モジュール、Mask2Formerデコーダを統合するエンドツーエンドフレームワークである。提案モデルでは,SSMに基づくアプローチに匹敵する推論レイテンシを保ち,高分解能な変更検出タスクに有効であることが示唆された。
論文参考訳（メタデータ） (2026-02-21T04:51:53Z)
No One-Model-Fits-All: Uncovering Spatio-Temporal Forecasting Trade-offs with Graph Neural Networks and Foundation Models [8.918505166222875]
本研究は,空間センサ密度とサンプリング間隔の異なる予測モデルについて,系統的研究を行った。以上の結果から,STGはセンサ配置が小さく,サンプリングレートが適度である場合に有効であることが示唆された。重要なことは、TSFMは高周波で競合するが、隣り合うセンサーからの空間被覆が減少すると劣化する。
論文参考訳（メタデータ） (2025-11-07T11:50:39Z)
HiFiNet: Hierarchical Fault Identification in Wireless Sensor Networks via Edge-Based Classification and Graph Aggregation [11.108171977551619]
HiFiNetは、無線ネットワークのための階層的な障害識別フレームワークである。局所時間パターンとネットワーク全体の空間依存性の両方をキャプチャすることで、より正確な予測を行う。既存の手法の精度、F1スコア、精度を著しく上回っている。
論文参考訳（メタデータ） (2025-11-06T16:15:19Z)
UniPhyNet: A Unified Network For Multimodal Physiological Raw Signal Classification [0.18416014644193066]
マルチモーダルな生理学的データを用いて認知負荷を分類するニューラルネットワークアーキテクチャUniPhyNetを提案する。 CL-Driveデータセットでは、UniPhyNetは生信号の分類精度を70%から80%(バイナリ)、62%から74%(3つ)に改善している。
論文参考訳（メタデータ） (2025-07-08T07:13:45Z)
RRCANet: Recurrent Reusable-Convolution Attention Network for Infrared Small Target Detection [23.54800619558163]
赤外線小目標検出は、その特徴のために難しい課題である。最近のCNNベースの手法は、重い特徴抽出と融合モジュールで有望な性能を実現している。赤外線小ターゲット検出のための再帰的再帰的再畳み込みアテンションネットワーク(RRCA-Net)を提案する。
論文参考訳（メタデータ） (2025-06-03T03:18:17Z)
MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings [7.9595266728435545]
本稿では,背景脳波(EEG)アーチファクト/ノイズから発作イベントを効率よく識別する,新しいエンド・ツー・エンドモデル「MR-EEGWaveNet」を提案する。このモデルには、畳み込み、特徴抽出、予測という3つのモジュールがある。提案したMR-EEGWaveNetは、従来の非多重分解能アプローチよりも大幅に優れていた。
論文参考訳（メタデータ） (2025-05-23T14:40:50Z)
IRASNet: Improved Feature-Level Clutter Reduction for Domain Generalized SAR-ATR [8.857297839399193]
本研究ではIRASNetと呼ばれるドメイン一般化SAR-ATRのためのフレームワークを提案する。 IRASNetは効果的な機能レベルのクラッタ削減とドメイン不変の機能学習を可能にする。 IRASNetは、性能を向上するだけでなく、特徴レベルのクラッタ低減を大幅に改善し、レーダ画像パターン認識の分野での貴重な進歩となる。
論文参考訳（メタデータ） (2024-09-25T11:53:58Z)
DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文参考訳（メタデータ） (2024-06-05T06:18:03Z)
Dual Attention U-Net with Feature Infusion: Pushing the Boundaries of Multiclass Defect Segmentation [1.487252325779766]
提案アーキテクチャであるDual Attentive U-Net with Feature Infusion (DAU-FI Net)はセマンティックセグメンテーションにおける課題に対処する。 DAU-FI Netは、複数スケールの空間チャネルアテンション機構と特徴注入を統合し、オブジェクトのローカライゼーションの精度を高める。挑戦的な下水道管と、欠陥データセットと、DAU-FI Netの能力を検証したベンチマークデータセットに関する総合的な実験。
論文参考訳（メタデータ） (2023-12-21T17:23:49Z)
TWR-MCAE: A Data Augmentation Method for Through-the-Wall Radar Human Motion Recognition [19.7631142728486]
本稿では,マルチリンク自動符号化ニューラルネットワーク(TWR-MCAE)データ拡張手法を提案する。提案アルゴリズムは、より優れたピーク信号-雑音比(PSNR)を得る。実験により,提案アルゴリズムはより優れたピーク信号対雑音比(PSNR)が得られることが示された。
論文参考訳（メタデータ） (2023-01-06T12:56:53Z)
Leveraging Spatio-Temporal Dependency for Skeleton-Based Action Recognition [9.999149887494646]
骨格をベースとした行動認識は、人体の骨格縫合のコンパクトな表現により、かなりの注目を集めている。グラフ畳み込みニューラルネットワーク(GCN)と畳み込みニューラルネットワーク(CNN)を用いた最近の多くの手法が目覚ましい性能を実現している。
論文参考訳（メタデータ） (2022-12-09T10:37:22Z)
Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。 NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。 NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文参考訳（メタデータ） (2022-10-14T18:00:07Z)
Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文参考訳（メタデータ） (2021-09-01T07:01:33Z)
Motor Imagery Classification based on CNN-GRU Network with Spatio-Temporal Feature Representation [22.488536453952964]
近年、脳波(EEG)信号に様々なディープニューラルネットワークが応用されている。脳波は非侵襲的に取得できる脳信号であり、時間分解能が高い。脳波信号は高次元の分類特徴空間を持つため,性能向上には適切な特徴抽出法が必要である。
論文参考訳（メタデータ） (2021-07-15T01:05:38Z)
ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文参考訳（メタデータ） (2021-05-07T11:39:05Z)
DS-Net: Dynamic Spatiotemporal Network for Video Salient Object Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文参考訳（メタデータ） (2020-12-09T06:42:30Z)
Contextual-Bandit Anomaly Detection for IoT Data in Distributed Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文参考訳（メタデータ） (2020-04-15T06:13:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。