論文の概要: PPG-Based Affect Recognition with Long-Range Deep Models: A Measurement-Driven Comparison of CNN, Transformer, and Mamba Architectures
- arxiv url: http://arxiv.org/abs/2604.26078v1
- Date: Tue, 28 Apr 2026 19:41:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.154827
- Title: PPG-Based Affect Recognition with Long-Range Deep Models: A Measurement-Driven Comparison of CNN, Transformer, and Mamba Architectures
- Title(参考訳): 長距離深層モデルを用いたPSGに基づく影響認識:CNN, Transformer, Mambaアーキテクチャの測定駆動比較
- Authors: Karim Alghoul, Hussein Al Osman, Abdulmotaleb El Saddik,
- Abstract要約: Photoplethysmography(進化)は、低コストでコンシューマーデバイスとの統合が容易なため、ウェアラブルの感情コンピューティングでますます使われている。
ディープラーニングの最近の進歩は、自然言語や一般的な時系列タスクに強いパフォーマンスを示すTransformersのような長距離シーケンスモデルを導入している。
本研究は,手首をベースとしたPSG信号から覚醒状態の分類を行うために,CNN,CNN-LSTMハイブリッド,Transformers,Mambaの4つのディープラーニングアーキテクチャを比較した。
- 参考スコア(独自算出の注目度): 14.439605533711472
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photoplethysmography (PPG) is increasingly used in wearable affective computing due to its low cost and ease of integration into consumer devices. Recent advances in deep learning have introduced long-range sequence models, such as Transformers, and state-space models, like Mamba, which have demonstrated strong performance on natural language and general time-series tasks. However, it remains unclear whether these architectures offer tangible benefits over widely used Convolutional Neural Networks (CNNs) and Long Short-Term Memory (LSTMs) for PPG-based affect recognition, given that datasets are typically small and noisy. This work presents a measurement-driven comparison of four deep learning architectures, CNN, CNN-LSTM hybrid, Transformers, and Mamba, for classifying arousal, valence, and relaxation states from wrist-based PPG signals. All models are evaluated under a subject-independent 5-fold cross-validation protocol using identical preprocessing, segmentation, and training pipelines. Our results show that the Transformer and Mamba models achieve performance comparable to that of a CNN baseline, but do not consistently outperform it across all tasks. CNNs remain the most effective overall, providing the highest accuracy with the smallest model size, whereas Transformers have a better balance of F1 scores for Arousal and Relaxation. The study provides the first evaluation of Transformer and Mamba models for PPG-based affect recognition, offering practical guidance on model selection for wearable affective monitoring systems.
- Abstract(参考訳): Photoplethysmography (PPG) は、低コストでコンシューマーデバイスへの統合が容易なため、ウェアラブルの感情コンピューティングでの利用が増えている。
近年のディープラーニングの進歩は、トランスフォーマーのような長距離シーケンスモデルや、Mambaのような状態空間モデルを導入している。
しかしながら、これらのアーキテクチャが一般的に使われている畳み込みニューラルネットワーク(CNN)やLPGベースの影響認識のためのLong Short-Term Memory(LSTM)よりも有意義なメリットを提供するかどうかは不明だ。
本研究は,手首をベースとしたPSG信号から,覚醒,原子価,緩和状態の分類を行うために,CNN,CNN-LSTMハイブリッド,Transformers,Mambaの4つのディープラーニングアーキテクチャを比較した。
すべてのモデルは、同一のプリプロセッシング、セグメンテーション、トレーニングパイプラインを使用して、主題に依存しない5倍のクロスバリデーションプロトコルで評価される。
この結果から,Transformer と Mamba モデルは CNN のベースラインに匹敵する性能を達成できるが,全てのタスクにおいて常に性能が向上するわけではない。
CNNはモデルサイズが最小であるのに対して、トランスフォーマーはArousalとRelaxationのF1スコアのバランスが良い。
本研究は、PTGに基づく感情認識のためのTransformerモデルとMambaモデルの最初の評価を行い、ウェアラブル感情モニタリングシステムにおけるモデル選択の実践的ガイダンスを提供する。
関連論文リスト
- ConvVitMamba: Efficient Multiscale Convolution, Transformer, and Mamba-Based Sequence modelling for Hyperspectral Image Classification [2.538209532048867]
ハイパスペクトル画像(HSI)分類は、高スペクトル次元、冗長性、ラベル付きデータによって依然として困難である。
ConvVitMambaと呼ばれる統合ハイブリッドフレームワークが、効率的なHSI分類のために提案されている。
このアーキテクチャは、3つのコンポーネントを統合する: 局所スペクトル、空間、関節パターンをキャプチャするマルチスケール畳み込み特徴抽出器、グローバルなコンテキスト関係をモデル化するビジョントランスフォーマーベースのトークン化とエンコーディングステージ、効率的なコンテンツ認識のための軽量なMambaインスパイアされたゲート配列混合モジュール。
論文 参考訳(メタデータ) (2026-04-20T21:26:51Z) - Mamba-3: Improved Sequence Modeling using State Space Principles [74.41028882099846]
線形モデルの状態空間モデル(SSM)の視点に触発された3つの中核的方法論的改善を紹介する。
アーキテクチャの改良とともに、Mamba-3モデルは、検索、状態追跡、下流言語モデリングタスク間で大きな進歩を遂げます。
論文 参考訳(メタデータ) (2026-03-16T17:30:08Z) - A comparative study of transformer models and recurrent neural networks for path-dependent composite materials [0.0]
短繊維強化複合材料(SFRC)の均質化応答列を学習したリカレントニューラルネットワーク(RNN)と変圧器モデルを比較した。
その結果、トランスフォーマーモデルは大きなデータセットの精度で競争力を維持するが、RNNは小さなデータセットの精度を向上することを示した。
論文 参考訳(メタデータ) (2026-02-17T09:29:54Z) - TYrPPG: Uncomplicated and Enhanced Learning Capability rPPG for Remote Heart Rate Estimation [51.56484100374058]
本稿では,効率的なRGBビデオのための革新的なビデオ理解ブロック(GVB)を提案する。
Mamの構造に基づいて、2D-CNNと3D-CNNを統合し、分析のためのビデオ理解を強化する。
実験により、我々のTYrは一般的に使用されるデータセットで最先端のパフォーマンスを達成できることが示された。
論文 参考訳(メタデータ) (2025-11-08T03:46:58Z) - Evaluating protein binding interfaces with PUMBA [1.089614199781423]
我々は、Vision TransformerのバックボーンをVision Mambaに置き換えることで、PIsToNを改善するPUMBAを紹介する。
その結果,タンパク質-タンパク質界面のグローバルパターンとローカルパターンの両方を捕捉する能力は大幅に向上した。
論文 参考訳(メタデータ) (2025-10-19T00:34:07Z) - SETransformer: A Hybrid Attention-Based Architecture for Robust Human Activity Recognition [7.291558599547268]
ウェアラブルセンサデータを用いたヒューマンアクティビティ認識(HAR)は,モバイルコンピューティング,ヘルスケア,人間とコンピュータのインタラクションにおいて中心的な課題となっている。
本稿では、トランスフォーマーに基づく時間モデルと、チャネルワイド・サスペンション・アンド・エキサイティング(SE)アテンションと、学習可能な時間アテンションプーリング機構を組み合わせたハイブリッドディープニューラルネットワークSETransformerを提案する。
我々は、WISDMデータセット上でSETransformerを評価し、LSTM、GRU、BiLSTM、CNNベースラインといった従来のモデルよりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2025-05-25T23:39:34Z) - Swin-UMamba: Mamba-based UNet with ImageNet-based pretraining [85.08169822181685]
本稿では,医療画像のセグメンテーションに特化して設計された新しいマンバモデルSwin-UMambaを紹介する。
Swin-UMamba は CNN や ViT,最新の Mamba ベースのモデルと比較して,優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-05T18:58:11Z) - Robust representations of oil wells' intervals via sparse attention
mechanism [2.604557228169423]
正規化変換器(Reguformers)と呼ばれる効率的な変換器のクラスを導入する。
私たちの実験の焦点は、石油とガスのデータ、すなわちウェルログにあります。
このような問題に対する我々のモデルを評価するために、20以上の井戸からなるウェルログからなる産業規模のオープンデータセットで作業する。
論文 参考訳(メタデータ) (2022-12-29T09:56:33Z) - A Battle of Network Structures: An Empirical Study of CNN, Transformer,
and MLP [121.35904748477421]
畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンのための支配的なディープニューラルネットワーク(DNN)アーキテクチャである。
トランスフォーマーとマルチ層パーセプトロン(MLP)ベースのモデル(Vision TransformerやVision-Mixer)が新しいトレンドを導い始めた。
本稿では,これらのDNN構造について実証的研究を行い,それぞれの長所と短所を理解しようとする。
論文 参考訳(メタデータ) (2021-08-30T06:09:02Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Visformer: The Vision-friendly Transformer [105.52122194322592]
我々は視覚に優しいトランスフォーマーから短縮したvisformerという新しいアーキテクチャを提案する。
同じ計算の複雑さにより、VisformerはTransformerベースのモデルとConvolutionベースのモデルの両方をImageNet分類精度で上回る。
論文 参考訳(メタデータ) (2021-04-26T13:13:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。