論文の概要: NAKUL-Med: Spectral-Graph State Space Models with Dynamics Kernels for Medical Signals
- arxiv url: http://arxiv.org/abs/2605.00871v1
- Date: Fri, 24 Apr 2026 13:27:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 06:56:26.484964
- Title: NAKUL-Med: Spectral-Graph State Space Models with Dynamics Kernels for Medical Signals
- Title(参考訳): NAKUL-Med:医療信号用ダイナミクスカーネルを用いたスペクトルグラフ状態空間モデル
- Authors: Badri N. Patro, Vijay S. Agneeswaran,
- Abstract要約: 状態空間モデル(SSM)は線形時間複雑性を実現するが、マルチチャネルの生理学的信号に苦慮する。
医療信号分析のためのSSMを拡張したNAKULを3つのコントリビューションで紹介する。
- 参考スコア(独自算出の注目度): 3.183924309596046
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: State space models (SSMs) achieve linear-time complexity but struggle with multi-channel physiological signals due to three limitations: fixed kernels cannot capture multi-scale temporal dynamics (motor preparation over hundreds of milliseconds vs. execution transients in tens of milliseconds), Markovian state updates restrict global context for periodic oscillations, and channel-independent processing ignores spatial electrode topology. We introduce NAKUL, extending SSMs for medical signal analysis through three contributions: (1) Dynamic Kernel Generation-parallel SSM branches with varying kernel sizes (3, 5, 7, 11 timesteps) are weighted by a meta-network that analyzes input statistics, enabling adaptive temporal scale selection; (2) Spectral Context Modeling-FFT-based operations with learnable Gaussian frequency band filters capture global periodic patterns in $O(N \log N)$ complexity; (3) Graph-Guided Spatial Attention-fixed electrode topology provides spatial biases to multi-head attention for principled cross-channel interaction. On BCI Competition IV-2a motor imagery (our primary benchmark), NAKUL achieves 91.7$\pm$0.6\% accuracy, matching EEG-Conformer (92.1$\pm$0.7\%) while using 28\% fewer parameters (2.5M vs 3.5M) and 2.0$\times$ faster inference (4.3ms vs 8.7ms). The model generalizes to EEG emotion recognition (83.6\%), multimodal EEG-fMRI (91.4\%), and medical imaging (92.8\% on ultrasound), demonstrating architectural versatility. Ablations show dynamic kernels contribute +2.6\% and exhibit interpretable scale selection patterns correlated with known neural dynamics.
- Abstract(参考訳): 状態空間モデル(SSM)は線形時間複雑性を実現するが、固定カーネルはマルチスケールの時間的ダイナミクス(数十ミリ秒での実行トランジェントに対する数百ミリ秒でのモダレーション)を捉えることができず、マルコフ状態の更新は周期的な振動のグローバルコンテキストを制限し、チャネルに依存しない処理は空間電極トポロジーを無視する。
1) 動的カーネル生成並列SSMブランチ(3, 5, 7, 11タイムステップ)は,入力統計を解析し,適応時間スケールの選択を可能にするメタネットワークによって重み付けされ,(2) 学習可能なガウス周波数帯域フィルタを用いたスペクトルコンテキストモデリング-FFTに基づく演算は,O(N \log N)$複雑性でグローバル周期パターンをキャプチャする。
BCIコンペティションIV-2aモーターイメージ(私たちのベンチマーク)では、NAKULは91.7$\pm$0.6\%の精度でEEG-Conformer(92.1$\pm$0.7\%)と一致し、28\%のパラメータ(2.5M vs 3.5M)と2.0$\times$高速推論(4.3ms vs 8.7ms)を使用する。
このモデルは、脳波の感情認識(83.6\%)、マルチモーダル脳波fMRI(91.4\%)、医療画像(92.8\%)に一般化され、アーキテクチャの汎用性を示す。
アブレーションは、動的カーネルが+2.6\%に寄与し、既知の神経力学と相関した解釈可能なスケール選択パターンを示す。
関連論文リスト
- Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.85385061275941]
分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文 参考訳(メタデータ) (2026-02-02T14:13:28Z) - ChronoSpike: An Adaptive Spiking Graph Neural Network for Dynamic Graphs [10.05203937088835]
スパイキングニューラルネットワークは、イベント駆動の効率を提供するが、シーケンシャルな伝播、バイナリ情報損失、グローバルなコンテキストを欠く局所的な集約によって制限される。
適応的なスパイクグラフニューラルネットワークであるChronoSpikeを提案する。このニューラルネットワークは、学習可能なLIFニューロンを膜間ダイナミクスと統合し、連続的な特徴に対する多頭部の空間的アグリゲーションと、トランスフォーマーの時間エンコーダである。
大規模な3つのベンチマークでは、ChronoSpikeは12の最先端のベースラインを$2.0%$マクロF1と$2.4%$マイクロF1で上回り、また、反復メソッドよりも3-10倍速いトレーニングを達成している。
論文 参考訳(メタデータ) (2026-02-01T09:50:21Z) - S2M-Net: Spectral-Spatial Mixing for Medical Image Segmentation with Morphology-Aware Adaptive Loss [0.0]
医療画像のセグメンテーションには、境界クリティカルな臨床応用のための局所的精度、解剖学的コヒーレンスのためのグローバルコンテキスト、および既存のアーキテクチャが解決できない限られたデータやハードウェア上のデプロイのための計算効率のバランスが必要である。
我々は,S2M-Netを提案する。S2M-Netは,S2M-Net,S2M-Net,S2M-Net,S2M-Net,S2M-Net,S2M-Net,S2M-Net,S2M-Net,S2M-Net,Morphology-Aware Adaptive Loss(MAS)の2つの相乗的イノベーションを通じて,グローバルなコンテキストを実現するためのアーキテクチャである。
論文 参考訳(メタデータ) (2026-01-03T21:03:54Z) - NeuroSSM: Multiscale Differential State-Space Modeling for Context-Aware fMRI Analysis [4.753690672619091]
本稿では,fMRI時系列における生BOLD信号のエンドツーエンド解析のための選択的状態空間アーキテクチャであるNeuroSSMを提案する。
NeuroSSMは2つの相補的な設計コンポーネントを通じて上記の制限に対処する。
臨床および非臨床データセットの実験は、NeuroSSMが最先端のfMRI分析法と競合する性能と効率を達成することを示した。
論文 参考訳(メタデータ) (2026-01-03T16:35:45Z) - PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.007237197267834]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文 参考訳(メタデータ) (2025-09-29T14:36:45Z) - Neuromorphic Wireless Split Computing with Resonate-and-Fire Neurons [69.73249913506042]
本稿では、共振器(RF)ニューロンを用いて時間領域信号を直接処理する無線スプリットコンピューティングアーキテクチャについて検討する。
可変周波数で共鳴することにより、RFニューロンは低スパイク活性を維持しながら時間局在スペクトル特徴を抽出する。
実験の結果,提案したRF-SNNアーキテクチャは従来のLIF-SNNやANNと同等の精度を達成できることがわかった。
論文 参考訳(メタデータ) (2025-06-24T21:14:59Z) - CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.466542039411515]
EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。
このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。
第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。
第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-06-10T17:20:39Z) - Spec2VolCAMU-Net: A Spectrogram-to-Volume Model for EEG-to-fMRI Reconstruction based on Multi-directional Time-Frequency Convolutional Attention Encoder and Vision-Mamba U-Net [13.510069069207548]
高分解能核磁気共鳴イメージング(fMRI)はヒト脳活動のマッピングに不可欠である。
既存のEEG-to-fMRIジェネレータは、チャネル間の時間周波数キューをキャプチャできないプレーンな畳み込みネットワーク(CNN)に依存している。
リッチな特徴抽出のための多方向時間周波数畳み込みアテンションを特徴とする軽量アーキテクチャであるSpec2VolCAMU-Netを提案する。
論文 参考訳(メタデータ) (2025-05-14T16:18:21Z) - Electromyography-Based Gesture Recognition: Hierarchical Feature Extraction for Enhanced Spatial-Temporal Dynamics [0.7083699704958353]
本稿では, 時間的時間的特徴抽出手法として, 軽量な圧縮励起深層学習手法を提案する。
提案したモデルは、Ninapro DB2、DB4、DB5データセットでそれぞれ96.41%、92.40%、93.34%の精度でテストされた。
論文 参考訳(メタデータ) (2025-04-04T07:11:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。