論文の概要: SleepVLM: Explainable and Rule-Grounded Sleep Staging via a Vision-Language Model
- arxiv url: http://arxiv.org/abs/2603.26738v1
- Date: Sun, 22 Mar 2026 09:18:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.554887
- Title: SleepVLM: Explainable and Rule-Grounded Sleep Staging via a Vision-Language Model
- Title(参考訳): SleepVLM:視覚ランゲージモデルによる説明可能で規則付き睡眠ステージング
- Authors: Guifeng Deng, Pan Wang, Jiquan Wang, Shuying Rao, Junyi Xie, Wanjun Guo, Tao Li, Haiteng Jiang,
- Abstract要約: SleepVLM(スリープVLM)は、多チャンネルポリソムノグラフィー(PSG)波形画像から睡眠を行うために設計された、ルール付き視覚言語モデル(VLM)である。
スリープVLMは、American Academy of Sleep Medicine (AASM) の基準に基づいて、臨床で読みやすい合理性を生成する。
専門家による評価では、実際の正確性、証拠の包括性、論理コヒーレンスの平均スコアが4.0/5.0を超え、モデルの推論の品質が検証された。
- 参考スコア(独自算出の注目度): 9.741417444397799
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While automated sleep staging has achieved expert-level accuracy, its clinical adoption is hindered by a lack of auditable reasoning. We introduce SleepVLM, a rule-grounded vision-language model (VLM) designed to stage sleep from multi-channel polysomnography (PSG) waveform images while generating clinician-readable rationales based on American Academy of Sleep Medicine (AASM) scoring criteria. Utilizing waveform-perceptual pre-training and rule-grounded supervised fine-tuning, SleepVLM achieved Cohen's kappa scores of 0.767 on an held out test set (MASS-SS1) and 0.743 on an external cohort (ZUAMHCS), matching state-of-the-art performance. Expert evaluations further validated the quality of the model's reasoning, with mean scores exceeding 4.0/5.0 for factual accuracy, evidence comprehensiveness, and logical coherence. By coupling competitive performance with transparent, rule-based explanations, SleepVLM may improve the trustworthiness and auditability of automated sleep staging in clinical workflows. To facilitate further research in interpretable sleep medicine, we release MASS-EX, a novel expert-annotated dataset.
- Abstract(参考訳): 自動睡眠ステージングは専門家レベルの精度を達成したが、その臨床応用は聴覚学的推論の欠如によって妨げられている。
アメリカ睡眠医学会(AASM)の評価基準に基づき,多チャンネルポリソムノグラフィー(PSG)波形画像から睡眠を評価するためのルール基底視覚言語モデル(VLM)であるSleepVLMを紹介した。
スリープVLMは、波形の事前学習と規則的な微調整を利用して、ホールドアウトテストセット(MASS-SS1)でコーエンのカッパスコア0.767、外部コホート(ZUAMHCS)で0.743を達成し、最先端の性能に適合した。
専門家による評価は、実際の正確性、証拠の包括性、論理コヒーレンスの平均スコアが4.0/5.0を超え、モデルの推論の品質をさらに検証した。
競合性能を透明で規則に基づく説明と組み合わせることで、SleepVLMは、臨床ワークフローにおける自動睡眠ステージングの信頼性と監査性を向上させることができる。
解釈可能な睡眠医学のさらなる研究を促進するために,我々は新たな専門家による注釈付きデータセットであるMASS-EXをリリースする。
関連論文リスト
- AI Generalisation Gap In Comorbid Sleep Disorder Staging [5.137280927017341]
iSLEEPS (iSLEEPS) を新たに導入した。
単一チャネル脳波睡眠ステージリングのためのSE-ResNet+双方向LSTMモデルの評価を行った。
健常者と疾患者のクロスドメインパフォーマンスは貧弱である。
論文 参考訳(メタデータ) (2026-03-24T15:02:35Z) - EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Sleep Position Classification using Transfer Learning for Bed-based Pressure Sensors [0.06282171844772422]
ベッドベースの感圧マット(PSM)は、睡眠中の患者を監視する非侵襲的な方法を提供する。
睡眠クリニックのマットレスの下に置かれたPSMから収集したデータを用いた4方向睡眠位置分類に焦点を当てた。
論文 参考訳(メタデータ) (2025-05-12T22:54:03Z) - WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.60244609728416]
言語モデル (LMs) は, 予後不良のリスクが高まれば, 臨床実習におけるモデルの実用性に対するリトマステストにはならない可能性がある, メンタルヘルスの分野では, 言語モデル (LMs) が提案されている。
ウェルネス次元(WD)の同定におけるLMの堅牢性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文 参考訳(メタデータ) (2024-06-17T19:50:40Z) - MSSC-BiMamba: Multimodal Sleep Stage Classification and Early Diagnosis of Sleep Disorders with Bidirectional Mamba [5.606144017978037]
本研究では,睡眠時ステージングと障害分類の自動モデルを構築し,診断精度と効率を向上させる。
マルチモード睡眠状態分類モデルMSSC-BiMamba を設計した。
このモデルは、マルチモーダルPSGデータを用いたスリープステージングにBiMambaを初めて適用し、計算とメモリ効率を大幅に向上させた。
論文 参考訳(メタデータ) (2024-05-30T15:16:53Z) - aSAGA: Automatic Sleep Analysis with Gray Areas [2.47298967960367]
最新の自動睡眠ステージング手法は、手動睡眠ステージングと同等の信頼性と優れた時間効率をすでに示している。
本稿では,睡眠分析のためのヒューマン・イン・ザ・ループの概念を提案し,臨床ポリソノグラフィー記録と在宅睡眠研究の両方で効果的に機能する自動睡眠ステージングモデル(aSAGA)を提案する。
論文 参考訳(メタデータ) (2023-10-03T13:17:38Z) - Sleep Activity Recognition and Characterization from Multi-Source
Passively Sensed Data [67.60224656603823]
睡眠活動認識法は、被験者の睡眠覚醒サイクルを評価し、監視し、特徴づけ、行動の変化を検出する指標を提供することができる。
本稿では,スマートフォンから受動的に知覚されたデータを連続的に操作して,睡眠の特徴を識別し,重要な睡眠エピソードを識別する一般的な方法を提案する。
これらの装置は、その用途により、連続的で客観的で非侵襲的な方法で被験者の生体リズムをプロファイルするための優れた代替データ源となっている。
論文 参考訳(メタデータ) (2023-01-17T15:18:45Z) - SERF: Interpretable Sleep Staging using Embeddings, Rules, and Features [0.0]
ポリソムノグラム(PSG)による臨床診断睡眠段階は、睡眠の質を評価するための金の基準である。
我々は,PSGを読むための埋め込み,ルール,特徴を用いたSERF,解釈可能なスリープステージを提案する。
SerFは、解釈可能な睡眠ステージングの最先端を2%超える。
論文 参考訳(メタデータ) (2022-09-21T10:01:56Z) - MSED: a multi-modal sleep event detection model for clinical sleep
analysis [62.997667081978825]
ポリソムノグラムで睡眠イベントを共同検出する,単一のディープニューラルネットワークアーキテクチャを設計した。
モデルの性能は,F1,精度,リコールスコア,および指標値と臨床値との相関で定量化した。
論文 参考訳(メタデータ) (2021-01-07T13:08:44Z) - Automatic detection of microsleep episodes with deep learning [55.41644538483948]
15秒未満の睡眠の短い断片は、マイクロスリープエピソード(MSEs)として定義される
覚醒検査(MWT)の維持は、警戒を評価するために臨床現場でしばしば用いられる。
MSEは、MSEを定義する確立された評価基準が欠如しているため、ほとんど考慮されていない。
入力として生の脳波とEOGデータに基づいて機械学習を用いてMSEを自動的に検出することを目的とした。
論文 参考訳(メタデータ) (2020-09-07T11:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。