論文の概要: Introducing Multimodal Paradigm for Learning Sleep Staging PSG via General-Purpose Model
- arxiv url: http://arxiv.org/abs/2509.22810v1
- Date: Fri, 26 Sep 2025 18:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:18.885025
- Title: Introducing Multimodal Paradigm for Learning Sleep Staging PSG via General-Purpose Model
- Title(参考訳): 汎用モデルによる睡眠時PSG学習のためのマルチモーダルパラダイムの導入
- Authors: Jianheng Zhou, Chenyu Liu, Jinan Zhou, Yi Ding, Yang Liu, Haoran Luo, Ziyu Jia, Xinliang Zhou,
- Abstract要約: 睡眠ステージングは、睡眠障害を診断し、神経学的健康を評価するために不可欠である。
既存の自動手法は、一般的に複雑なポリソノグラフィ(PSG)信号から特徴を抽出し、ドメイン固有のモデルを訓練する。
臨床診断の実践をエミュレートするために,大規模な多モード汎用モデルを活用する睡眠ステージングの新しいパラダイムを導入する。
- 参考スコア(独自算出の注目度): 25.949760386728354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sleep staging is essential for diagnosing sleep disorders and assessing neurological health. Existing automatic methods typically extract features from complex polysomnography (PSG) signals and train domain-specific models, which often lack intuitiveness and require large, specialized datasets. To overcome these limitations, we introduce a new paradigm for sleep staging that leverages large multimodal general-purpose models to emulate clinical diagnostic practices. Specifically, we convert raw one-dimensional PSG time-series into intuitive two-dimensional waveform images and then fine-tune a multimodal large model to learn from these representations. Experiments on three public datasets (ISRUC, MASS, SHHS) demonstrate that our approach enables general-purpose models, without prior exposure to sleep data, to acquire robust staging capabilities. Moreover, explanation analysis reveals our model learned to mimic the visual diagnostic workflow of human experts for sleep staging by PSG images. The proposed method consistently outperforms state-of-the-art baselines in accuracy and robustness, highlighting its efficiency and practical value for medical applications. The code for the signal-to-image pipeline and the PSG image dataset will be released.
- Abstract(参考訳): 睡眠ステージングは、睡眠障害を診断し、神経学的健康を評価するために不可欠である。
既存の自動手法は、通常、複雑なポリソノグラフィ(PSG)信号から特徴を抽出し、直感性を欠き、大きな特別なデータセットを必要とするドメイン固有モデルを訓練する。
これらの制約を克服するため、我々は、多目的多目的モデルを利用して臨床診断の実践をエミュレートする睡眠ステージングの新しいパラダイムを導入する。
具体的には、生の1次元PSG時系列を直感的な2次元波形画像に変換し、その表現から学習するためにマルチモーダルな大モデルを微調整する。
3つの公開データセット(ISRUC, MASS, SHHS)に対する実験により、我々のアプローチは、睡眠データに事前に触れることなく汎用モデルにより、堅牢なステージング能力を得ることができることを示した。
さらに,PSG画像による睡眠時ステージングにおいて,人間の視覚的診断ワークフローを模倣するために学習したモデルを明らかにした。
提案手法は精度とロバスト性において最先端のベースラインを一貫して上回り,医療応用におけるその効率性と実用的価値を強調した。
signal-to-imageパイプラインとPSGイメージデータセットのコードがリリースされる。
関連論文リスト
- Sleep Stage Classification using Multimodal Embedding Fusion from EOG and PSM [0.06282171844772422]
本研究では,マルチモーダル埋め込み深層学習モデルであるImageBindを用いて,睡眠段階分類のためのデュアルチャネルEOG信号とPSMデータを統合する手法を提案する。
以上の結果から,ImageBindの微調整により分類精度が向上し,既存のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-06-07T20:18:45Z) - Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models [32.17651741681871]
合成ポリプ画像を生成するためのプログレッシブスペクトル拡散モデル(PSDM)を提案する。
PSDMは、セグメンテーションマスク、バウンディングボックス、大腸内視鏡検査などの様々な臨床アノテーションを統合し、それらを合成プロンプトに変換する。
トレーニングデータをPSDM生成サンプルで強化することにより,ポリプの検出,分類,セグメンテーションを大幅に改善する。
論文 参考訳(メタデータ) (2025-02-25T08:22:45Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - MSSC-BiMamba: Multimodal Sleep Stage Classification and Early Diagnosis of Sleep Disorders with Bidirectional Mamba [5.606144017978037]
本研究では,睡眠時ステージングと障害分類の自動モデルを構築し,診断精度と効率を向上させる。
マルチモード睡眠状態分類モデルMSSC-BiMamba を設計した。
このモデルは、マルチモーダルPSGデータを用いたスリープステージングにBiMambaを初めて適用し、計算とメモリ効率を大幅に向上させた。
論文 参考訳(メタデータ) (2024-05-30T15:16:53Z) - Generative Medical Segmentation [5.4613210257624605]
生成医療 (Generative Medical, GMS) は、生成モデルを利用して画像セグメンテーションを行う新しいアプローチである。
GMSは、画像とそれに対応する接地真実マスクの潜在表現を抽出するために、頑健な事前訓練された視覚基盤モデルを採用している。
GMSの設計により、モデルのトレーニング可能なパラメータが少なくなり、オーバーフィットのリスクが軽減され、その能力が向上する。
論文 参考訳(メタデータ) (2024-03-27T02:16:04Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Self-Supervised and Semi-Supervised Polyp Segmentation using Synthetic
Data [16.356954231068077]
大腸ポリープの早期検出は、その治療および大腸癌予防において最も重要である。
コンピュータビジョン技術は、患者の大腸全体を調べるために手動で大腸手術を行う、診断段階の専門家を助ける可能性がある。
医用画像の最大の課題はデータの欠如であり、ポリプセグメンテーションアプローチに特有な課題は、手動でデータをラベル付けすることの難しさである。
本稿では, 実データと合成データを統合し, データセットのサイズを人工的に増加させ, ラベルなしサンプルが利用可能になった場合のトレーニングを支援する, ポリプセグメンテーションのエンドツーエンドモデルを提案する。
論文 参考訳(メタデータ) (2023-07-22T09:57:58Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。