論文の概要: Stress Classification from ECG Signals Using Vision Transformer
- arxiv url: http://arxiv.org/abs/2603.26721v1
- Date: Thu, 19 Mar 2026 01:47:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.107152
- Title: Stress Classification from ECG Signals Using Vision Transformer
- Title(参考訳): 視覚変換器を用いた心電図信号からの応力分類
- Authors: Zeeshan Ahmad, Naimul Khan,
- Abstract要約: 短時間フーリエ変換(STFT)を用いた生ECGデータを2次元スペクトログラムに変換する。
1D CNNとResNet-18(CNNモデル)の実験も行います。
実験により、視覚変換器はCNNベースのモデルよりも、物体間変動の効果をはるかに良く扱うことが示された。
- 参考スコア(独自算出の注目度): 3.1368611610608856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision Transformers have shown tremendous success in numerous computer vision applications; however, they have not been exploited for stress assessment using physiological signals such as Electrocardiogram (ECG). In order to get the maximum benefit from the vision transformer for multilevel stress assessment, in this paper, we transform the raw ECG data into 2D spectrograms using short time Fourier transform (STFT). These spectrograms are divided into patches for feeding to the transformer encoder. We also perform experiments with 1D CNN and ResNet-18 (CNN model). We perform leave-onesubject-out cross validation (LOSOCV) experiments on WESAD and Ryerson Multimedia Lab (RML) dataset. One of the biggest challenges of LOSOCV based experiments is to tackle the problem of intersubject variability. In this research, we address the issue of intersubject variability and show our success using 2D spectrograms and the attention mechanism of transformer. Experiments show that vision transformer handles the effect of intersubject variability much better than CNN-based models and beats all previous state-of-the-art methods by a considerable margin. Moreover, our method is end-to-end, does not require handcrafted features, and can learn robust representations. The proposed method achieved 71.01% and 76.7% accuracies with RML dataset and WESAD dataset respectively for three class classification and 88.3% for binary classification on WESAD.
- Abstract(参考訳): 視覚変換器は多くのコンピュータビジョン応用において大きな成功を収めてきたが、心電図(ECG)のような生理学的信号を用いたストレス評価には利用されていない。
本稿では,マルチレベルストレスアセスメントのための視覚変換器の最大限の利点を得るために,短時間フーリエ変換(STFT)を用いて生ECGデータを2次元スペクトログラムに変換する。
これらのスペクトログラムは変換器エンコーダに供給するためのパッチに分割される。
また,1D CNNとResNet-18(CNNモデル)を用いて実験を行った。
我々は WESAD と Ryerson Multimedia Lab (RML) データセット上で LOSOCV (Left-onesubject-out Cross Validation) 実験を行う。
LOSOCVをベースとした実験の最大の課題の1つは、物体間変動の問題に取り組むことである。
本研究では、物体間変動の問題に対処し、2次元スペクトログラムと変圧器の注意機構を用いて、我々の成功を示す。
実験により、視覚変換器はCNNモデルよりも物体間変動効果をはるかに良く扱い、従来の最先端手法をかなりのマージンで打ち負かすことが示された。
さらに,本手法はエンドツーエンドであり,手作りの機能を必要とせず,頑健な表現を学習することができる。
提案手法は, RML データセットと WESAD データセットでそれぞれ 71.01% と 76.7% の精度を達成し, WESAD の2進分類では 88.3% を達成した。
関連論文リスト
- Pose Matters: Evaluating Vision Transformers and CNNs for Human Action Recognition on Small COCO Subsets [0.0]
本研究では,COCO画像コーパスの3クラスサブセットを用いた人間の認識について検討する。
バイナリビジョン変換器(ViT)は90%の平均テスト精度を達成した。
論文 参考訳(メタデータ) (2025-06-13T11:16:50Z) - FactoFormer: Factorized Hyperspectral Transformers with Self-Supervised
Pretraining [36.44039681893334]
ハイパースペクトル画像(HSI)は、豊富なスペクトルと空間情報を含む。
現在の最先端ハイパースペクトル変換器は、入力されたHSIサンプルをスペクトル次元に沿ってトークン化するのみである。
本稿では、自己教師付き事前学習手順を取り入れた新しい分解スペクトル空間変換器を提案する。
論文 参考訳(メタデータ) (2023-09-18T02:05:52Z) - Masked Transformer for Electrocardiogram Classification [7.229662895786343]
MTECG(Masked Transformer for ECG classification)は、ECG分類における最新の最先端アルゴリズムを著しく上回る、単純かつ効果的な手法である。
220,251個の心電図記録と広範囲の診断を行い,医療専門家が注釈を付した不破井データセットを構築した。
論文 参考訳(メタデータ) (2023-08-31T09:21:23Z) - More for Less: Compact Convolutional Transformers Enable Robust Medical
Image Classification with Limited Data [0.0]
本研究では,限られたデータを用いた医用画像分類におけるコンパクト畳み込み変換器の有効性について検討した。
変換器と畳み込み層のハイブリッドであるCCTは、適度なサイズのデータセットに対して高い精度を示す。
論文 参考訳(メタデータ) (2023-07-01T03:31:30Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Iwin: Human-Object Interaction Detection via Transformer with Irregular
Windows [57.00864538284686]
Iwin Transformerは階層型トランスフォーマーで、不規則ウィンドウ内でトークン表現学習とトークン集約を行う。
Iwin Transformerの有効性と効率を,2つの標準HOI検出ベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-03-20T12:04:50Z) - SepTr: Separable Transformer for Audio Spectrogram Processing [74.41172054754928]
分離可能トランス (Separable Transformer, SepTr) と呼ばれる新しい視覚変換器アーキテクチャを提案する。
SepTrは2つのトランスフォーマーブロックを逐次的に使用し、1つは同じ周波数ビン内のトークンに、もう1つは同じ時間間隔でトークンに出席する。
我々は3つのベンチマークデータセットで実験を行い、我々のアーキテクチャが従来のビジョントランスフォーマーや他の最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-17T19:48:43Z) - ViTAEv2: Vision Transformer Advanced by Exploring Inductive Bias for
Image Recognition and Beyond [76.35955924137986]
我々は、内在性IBを畳み込み、すなわちViTAEから探索するビジョントランスフォーマーを提案する。
ViTAEはいくつかの空間ピラミッド縮小モジュールを備えており、入力イメージをリッチなマルチスケールコンテキストでトークンに埋め込む。
我々は、ImageNet検証セット上で88.5%のTop-1分類精度と、ImageNet実検証セット上で最高の91.2%のTop-1分類精度を得る。
論文 参考訳(メタデータ) (2022-02-21T10:40:05Z) - A Transformer Architecture for Stress Detection from ECG [7.559720049837459]
本稿では、畳み込み層に基づくディープニューラルネットワークと、ECG信号を用いたストレス検出のためのトランスフォーマー機構を提案する。
実験の結果,提案手法は心電図に基づくストレス検出のための最先端モデルに匹敵する,あるいは優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-08-22T14:34:44Z) - Vision Transformers are Robust Learners [65.91359312429147]
ビジョントランスフォーマー(ViT)の一般的な腐敗や摂動、分布シフト、自然逆転例に対する堅牢性について検討します。
ViTsが実際により堅牢な学習者である理由を説明するために、定量的および定性的な指標を提供する分析を提示します。
論文 参考訳(メタデータ) (2021-05-17T02:39:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。