論文の概要: D-FaST: Cognitive Signal Decoding with Disentangled Frequency-Spatial-Temporal Attention
- arxiv url: http://arxiv.org/abs/2406.02602v1
- Date: Sun, 2 Jun 2024 02:33:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 23:39:37.241485
- Title: D-FaST: Cognitive Signal Decoding with Disentangled Frequency-Spatial-Temporal Attention
- Title(参考訳): D-FaST: 周波数・空間・テンポラルアテンションによる認知信号復号
- Authors: Weiguo Chen, Changjian Wang, Kele Xu, Yuan Yuan, Yanru Bai, Dongsong Zhang,
- Abstract要約: 我々は、D-FaST(Disentangled Frequency-Spatial-Temporal Attention)と呼ばれるCLPのための新しいパラダイムを導入する。
本稿では,周波数空間領域の非絡み合いに着目した新しい認知信号デコーダを提案する。
実験の結果、D-FaSTは既存の手法よりも、我々のデータセットと従来のCDDデータセットの両方で優れていることが示された。
- 参考スコア(独自算出の注目度): 14.750653953503205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cognitive Language Processing (CLP), situated at the intersection of Natural Language Processing (NLP) and cognitive science, plays a progressively pivotal role in the domains of artificial intelligence, cognitive intelligence, and brain science. Among the essential areas of investigation in CLP, Cognitive Signal Decoding (CSD) has made remarkable achievements, yet there still exist challenges related to insufficient global dynamic representation capability and deficiencies in multi-domain feature integration. In this paper, we introduce a novel paradigm for CLP referred to as Disentangled Frequency-Spatial-Temporal Attention(D-FaST). Specifically, we present an novel cognitive signal decoder that operates on disentangled frequency-space-time domain attention. This decoder encompasses three key components: frequency domain feature extraction employing multi-view attention, spatial domain feature extraction utilizing dynamic brain connection graph attention, and temporal feature extraction relying on local time sliding window attention. These components are integrated within a novel disentangled framework. Additionally, to encourage advancements in this field, we have created a new CLP dataset, MNRED. Subsequently, we conducted an extensive series of experiments, evaluating D-FaST's performance on MNRED, as well as on publicly available datasets including ZuCo, BCIC IV-2A, and BCIC IV-2B. Our experimental results demonstrate that D-FaST outperforms existing methods significantly on both our datasets and traditional CSD datasets including establishing a state-of-the-art accuracy score 78.72% on MNRED, pushing the accuracy score on ZuCo to 78.35%, accuracy score on BCIC IV-2A to 74.85% and accuracy score on BCIC IV-2B to 76.81%.
- Abstract(参考訳): 自然言語処理(NLP)と認知科学の交差点に位置する認知言語処理(CLP)は、人工知能、認知知能、脳科学の分野において、徐々に重要な役割を担っている。
認知信号復号法(Cognitive Signal Decoding, CSD)は, CLPにおける重要な研究分野のひとつだが, グローバルな動的表現能力の不足, マルチドメイン機能統合の欠如など, まだまだ課題が残っている。
本稿では,D-FaST(Disentangled Frequency-Spatial-Temporal Attention)と呼ばれるCLPの新しいパラダイムを提案する。
具体的には,周波数空間領域の非絡み合いに着目した新しい認知信号デコーダを提案する。
このデコーダは、マルチビューアテンションを利用した周波数領域特徴抽出、ダイナミック脳接続グラフアテンションを利用した空間領域特徴抽出、局所時間スライディングウインドウアテンションを利用した時間特徴抽出の3つの重要な構成要素を含む。
これらのコンポーネントは、新しいアンタングルフレームワークに統合されている。
さらに、この分野の進歩を促進するために、我々は新しいCLPデータセットMNREDを作成しました。
その後,MNRED上でのD-FaSTの性能評価や,ZuCo,BCIC IV-2A,BCIC IV-2Bなどの公開データセットの検証を行った。
我々の実験結果によると、D-FaSTは、MNREDの最先端精度スコア78.72%、ZuCoの精度スコア78.35%、BCIC IV-2Aの精度スコア74.85%、BCIC IV-2Bの精度スコア76.81%など、我々のデータセットと従来のCSDデータセットの両方において、既存の手法よりも大幅に優れていた。
関連論文リスト
- Efficient Spatio-Temporal Signal Recognition on Edge Devices Using PointLCA-Net [0.45609532372046985]
本稿では、ポイントネットの特徴抽出とインメモリコンピューティング能力と時間信号認識のためのニューロモルフィックシステムのエネルギー効率を組み合わせたアプローチを提案する。
PointNetは、推定とトレーニングの両方において、同等のアプローチよりも高い精度とエネルギー負担を著しく低減します。
論文 参考訳(メタデータ) (2024-11-21T20:48:40Z) - Analysis and Fully Memristor-based Reservoir Computing for Temporal Data Classification [0.6291443816903801]
Reservoir Computing (RC) は、特に信号処理に有効なニューロモルフィックなフレームワークを提供する。
RCハードウェアのキーコンポーネントは動的貯留状態を生成する能力である。
本研究は, 新たな時間的課題の管理において, メムリスタをベースとしたRCシステムの適応性を照らすものである。
論文 参考訳(メタデータ) (2024-03-04T08:22:29Z) - CLAN: A Contrastive Learning based Novelty Detection Framework for Human
Activity Recognition [3.0108863071498035]
CLANは、人間の活動認識のための2段階のコントラスト学習に基づく新規性検出フレームワークである。
それは、時間的および周波数的特徴の重要さを含む、人間の活動特性に関する課題に合わせたものである。
4つの実世界の人間活動データセットの実験により、CLANは既存の新規性検出手法の最高の性能を上回っていることが示された。
論文 参考訳(メタデータ) (2024-01-17T03:57:36Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - Frequency-domain MLPs are More Effective Learners in Time Series
Forecasting [67.60443290781988]
時系列予測は、金融、交通、エネルギー、医療など、さまざまな産業領域において重要な役割を果たしてきた。
最多ベースの予測手法は、ポイントワイドマッピングと情報のボトルネックに悩まされる。
本稿では、時系列予測のための周波数領域上に構築された、シンプルで効果的なアーキテクチャであるFreTSを提案する。
論文 参考訳(メタデータ) (2023-11-10T17:05:13Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Deep Recurrent Learning for Heart Sounds Segmentation based on
Instantaneous Frequency Features [0.0]
主成分にPCGをセグメント化できるディープリカレントニューラルネットワークを示す。
本手法は,5秒以上,35秒未満で使用可能なデータベースから,心臓音信号に対して実験を行った。
このアプローチは最先端のパフォーマンスをほぼ達成し、平均感度は89.5%、平均正の予測値は89.3%、平均精度は91.3%であった。
論文 参考訳(メタデータ) (2022-01-27T04:40:09Z) - On Exploring Pose Estimation as an Auxiliary Learning Task for
Visible-Infrared Person Re-identification [66.58450185833479]
本稿では,Pose Estimationを補助学習タスクとして活用して,エンドツーエンドフレームワークにおけるVI-ReIDタスクを支援する。
これら2つのタスクを相互に有利な方法で共同でトレーニングすることにより、高品質なモダリティ共有とID関連の特徴を学習する。
2つのベンチマークVI-ReIDデータセットの実験結果から,提案手法は一定のマージンで最先端の手法を継続的に改善することが示された。
論文 参考訳(メタデータ) (2022-01-11T09:44:00Z) - Temporal Memory Relation Network for Workflow Recognition from Surgical
Video [53.20825496640025]
本研究では, 長期および多スケールの時間パターンを関連づける, エンドツーエンドの時間メモリ関係ネットワーク (TMNet) を提案する。
我々はこのアプローチを2つのベンチマーク手術ビデオデータセットで広範囲に検証した。
論文 参考訳(メタデータ) (2021-03-30T13:20:26Z) - Using GAN to Enhance the Accuracy of Indoor Human Activity Recognition [0.9239657838690226]
本研究では,長期記憶(LSTM)を用いて特徴を学習し,7つの異なる行動を認識する,行動認識システムのための半教師付き学習手法を提案する。
実験の結果,分類精度を3.4%向上し,ログ損失を約16%低減できることを確認した。
論文 参考訳(メタデータ) (2020-04-23T15:22:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。