論文の概要: SPOTR: Spatio-temporal Pooling One-Token Reconstruction for Universal Physiological Signal Self-supervised Learning
- arxiv url: http://arxiv.org/abs/2606.21973v1
- Date: Sat, 20 Jun 2026 10:01:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 23:27:47.381714
- Title: SPOTR: Spatio-temporal Pooling One-Token Reconstruction for Universal Physiological Signal Self-supervised Learning
- Title(参考訳): SPOTR : 広汎な生理信号自己教師型学習のための時空間ポーリングワンツーケン再構成
- Authors: Yiyu Gui, Mingzhi Chen, Yuesheng Zhu, Guibo Luo, Yuchao Yang,
- Abstract要約: SPOTR (Spatio-temporal Pooling One-Token Reconstruction) は, 生理学的信号の圧縮・再構成事前学習フレームワークである。
SPOTRは各波形を一括表現に圧縮し、この表現にのみ条件付き信号ボトルネックを再構成する。
EEG、iEEG、ECG、PPGにまたがる20のデータセットで事前訓練されたSPOTRは、線形探索において最強のベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 18.599696865060835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physiological signals such as EEG, ECG, and PPG are widely used in clinical monitoring. Recent self-supervised learning (SSL) methods offer an attractive way to leverage unlabeled recordings, yet they still fall short in practice. In particular, current SSL methods struggle across heterogeneous datasets, often distorting clinically meaningful structures or learning shortcuts from temporal and cross-channel redundancy. Consequently, existing SSL methods often deliver limited performance under linear probing, a lightweight adaptation setting that better matches real-world medical scenarios. Moreover, most Transformer-based SSL models encode a flattened spatiotemporal token sequence, incurring high computation and memory cost, and are typically developed within a single modality. To address these limitations, we present SPOTR (Spatio-temporal Pooling One-Token Reconstruction), a compress-reconstruct pretraining framework that introduces a single-token global bottleneck for physiological signals. SPOTR compresses each waveform into a single-token representation and reconstructs the signal conditioned only on this representation. Meanwhile, SPOTR introduces an efficient spatio-temporal compaction module to reduce computation and memory cost. Pretrained on 20 datasets spanning EEG, iEEG, ECG, and PPG, SPOTR consistently outperforms the strongest baseline under linear probing, improving average AUC by 18.49%, 21.71%, 17.86%, and 4.64%, respectively. Compared with a representative general-purpose time-series foundation model, SPOTR achieves around 78% lower latency and 52% lower peak GPU memory on average. The code can be found at https://github.com/5GYYYYY/SPOTR.
- Abstract(参考訳): 脳波、心電図、PSGなどの生理学的シグナルは臨床モニタリングに広く用いられている。
最近の自己教師付き学習(SSL)手法は、ラベルのない記録を活用する魅力的な方法を提供しているが、実際には不足している。
特に、現在のSSLメソッドは、しばしば臨床的に意味のある構造を歪めたり、時間的および横断的な冗長性からショートカットを学習するなど、異種データセット間で苦労している。
結果として、既存のSSLメソッドは、現実の医療シナリオによくマッチする軽量な適応設定であるリニアプローブの下で、限られたパフォーマンスを提供することが多い。
さらに、ほとんどのTransformerベースのSSLモデルは、平らな時空間トークンシーケンスを符号化し、高い計算とメモリコストを発生させ、通常は単一のモードで開発される。
これらの制約に対処するため、SPOTR(Spatio-temporal Pooling One-Token Reconstruction)は、生理学的信号に単一トーケンのグローバルボトルネックを導入する圧縮再構成事前学習フレームワークである。
SPOTRは各波形を1つのトーケン表現に圧縮し、この表現にのみ条件付けられた信号を再構成する。
一方、SPOTRは、計算とメモリコストを削減するために、効率的な時空間圧縮モジュールを導入している。
EEG、iEEG、ECG、PSGにまたがる20のデータセットで事前訓練されたSPOTRは、線形探査において最強のベースラインを一貫して上回り、平均AUCを18.49%、21.71%、17.86%、および4.64%改善している。
一般的な汎用時系列基盤モデルと比較して、SPOTRは平均して78%のレイテンシと52%のピークGPUメモリを実現している。
コードはhttps://github.com/5GYYYYYY/SPOTRで見ることができる。
関連論文リスト
- Using Explainability as a Training-Time Reliability Signal for Efficient ECG Classification [14.279568423870572]
本稿では、効率的なECG分類のための説明可能性に基づく信頼性訓練信号ERTSを紹介する。
ERTSは、情報的不確実性と信頼できない不確実性を区別するために、トレーニング中に説明品質を使用する。
3つのECGデータセットと複数のバックボーンアーキテクチャにまたがるERTSを評価し,有効トレーニングコストの削減とともにマクロF1の改善が一貫したことを示す。
論文 参考訳(メタデータ) (2026-06-10T15:55:00Z) - Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文 参考訳(メタデータ) (2026-05-21T16:45:31Z) - Monitoring Neural Training with Topology: A Footprint-Predictable Collapse Index [51.56484100374058]
我々は,MHM(Modular Morse Homology maintenance)とCI(Composite Collapse Index)を併用したオンライントポロジ対応型神経表現モニタを提案する。
コンプレックスを再構築する代わりに、スパース編集を一定のスケールで適用し、離散的なモースマッチングを維持し、高速でインクリメンタルな更新をもたらす。
論文 参考訳(メタデータ) (2026-04-28T19:21:21Z) - When Learning Hurts: Fixed-Pole RNN for Real-Time Online Training [58.25341036646294]
本研究では,再帰性極の学習がデータに有意な利点をもたらしない理由を解析的に検討し,実時間学習シナリオを実証的に提供する。
固定極ネットワークは、トレーニングの複雑さを低減し、オンラインリアルタイムタスクにより適していることを示す。
論文 参考訳(メタデータ) (2026-02-25T00:15:13Z) - Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - Moving Beyond Functional Connectivity: Time-Series Modeling for fMRI-Based Brain Disorder Classification [8.837732238971187]
機能的磁気共鳴イメージング(fMRI)は、血液酸素レベル依存(BOLD)シグナルをキャプチャすることで、非侵襲的な脳障害の分類を可能にする。
既存のほとんどの手法はピアソン相関による機能接続(FC)に依存している。
5つの公開データセットにまたがる生のBOLD信号に関する最先端の時間モデルをベンチマークする。
論文 参考訳(メタデータ) (2026-02-09T04:42:42Z) - WaveNet's Precision in EEG Classification [1.0885910878567457]
本研究では,脳波信号の生理的,病理学的,アーティファクト的,ノイズ的分類の自動化を目的としたWaveNetに基づくディープラーニングモデルを提案する。
モデルは、70/20/10%のスプリットで209,232個のサンプルをトレーニングし、検証し、テストした。
WaveNetのアーキテクチャは、もともと生音声合成のために開発されたもので、拡張因果畳み込みと残差接続を使用するため、EEGデータによく適している。
論文 参考訳(メタデータ) (2025-10-10T09:21:21Z) - NeRF-based CBCT Reconstruction needs Normalization and Initialization [53.58395475423445]
NeRFベースの手法は、ハッシュエンコーダとニューラルネットワークという2つの主要なコンポーネント間の局所的な訓練ミスマッチに悩まされる。
特徴整合性を高め、ミスマッチを緩和する正規化ハッシュを導入する。
ニューラルネットワークは早期トレーニング中に安定性が向上し、より高速な収束と再構築性能が向上する。
論文 参考訳(メタデータ) (2025-06-24T16:01:45Z) - Training-free Ultra Small Model for Universal Sparse Reconstruction in Compressed Sensing [39.36305648162564]
本稿では,係数学習(CL)と呼ばれる超小型人工ニューラルモデルを提案する。
CLは、従来の反復的手法の一般性と解釈性を継承しつつ、トレーニング不要で迅速なスパース再構築を可能にする。
代表的反復法と比較して、CLOMPは大規模データの効率を100から1000倍に改善する。
論文 参考訳(メタデータ) (2025-01-20T16:50:59Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。