論文の概要: Who Should Have Surgery? A Comparative Study of GenAI vs Supervised ML for CRS Surgical Outcome Prediction
- arxiv url: http://arxiv.org/abs/2601.13710v1
- Date: Tue, 20 Jan 2026 08:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.219431
- Title: Who Should Have Surgery? A Comparative Study of GenAI vs Supervised ML for CRS Surgical Outcome Prediction
- Title(参考訳): 誰が手術をすべきなのか : CRS手術成績予測におけるGenAI対MLの比較検討
- Authors: Sayeed Shafayet Chowdhury, Snehasis Mukhopadhyay, Shiaofen Fang, Vijay R. Ramakrishnan,
- Abstract要約: 慢性副鼻腔炎(CRS)の術前予後予測について検討した。
全患者が手術を受けた前向きに収集したコホートでは,術前臨床データのみを用いたモデルで,予後不良者を特定することができた。
最適MLモデル(MLP)は、キャリブレーションと決定曲線ネットの利点に優れた精度で85%の精度を達成する。
- 参考スコア(独自算出の注目度): 2.1349209400003932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence has reshaped medical imaging, yet the use of AI on clinical data for prospective decision support remains limited. We study pre-operative prediction of clinically meaningful improvement in chronic rhinosinusitis (CRS), defining success as a more than 8.9-point reduction in SNOT-22 at 6 months (MCID). In a prospectively collected cohort where all patients underwent surgery, we ask whether models using only pre-operative clinical data could have identified those who would have poor outcomes, i.e. those who should have avoided surgery. We benchmark supervised ML (logistic regression, tree ensembles, and an in-house MLP) against generative AI (ChatGPT, Claude, Gemini, Perplexity), giving each the same structured inputs and constraining outputs to binary recommendations with confidence. Our best ML model (MLP) achieves 85 % accuracy with superior calibration and decision-curve net benefit. GenAI models underperform on discrimination and calibration across zero-shot setting. Notably, GenAI justifications align with clinician heuristics and the MLP's feature importance, repeatedly highlighting baseline SNOT-22, CT/endoscopy severity, polyp phenotype, and physchology/pain comorbidities. We provide a reproducible tabular-to-GenAI evaluation protocol and subgroup analyses. Findings support an ML-first, GenAI- augmented workflow: deploy calibrated ML for primary triage of surgical candidacy, with GenAI as an explainer to enhance transparency and shared decision-making.
- Abstract(参考訳): 人工知能は医療画像を再形成してきたが、将来的な意思決定支援のための臨床データにAIを使用することは、まだ限られている。
慢性副鼻腔炎 (CRS) の術前改善予測について検討し, SNOT-22は6カ月間(MCID)で8.9ポイント以上低下した。
全患者が手術を受ける前向きに収集されたコホートでは,術前臨床データのみを用いたモデルで予後不良者,すなわち手術を避けるべき者を特定することができたのかを問う。
我々は、生成AI(ChatGPT、Claude、Gemini、Perplexity)に対してML(論理回帰、ツリーアンサンブル、社内MLP)をベンチマークし、それぞれが同じ構造化された入力と出力を自信を持ってバイナリレコメンデーションに制限する。
最適MLモデル(MLP)は、キャリブレーションと決定曲線ネットの利点に優れた精度で85%の精度を達成する。
GenAIモデルはゼロショット設定での差別とキャリブレーションでパフォーマンスが劣る。
特に、GenAIの正当性は臨床のヒューリスティックスやMDPの特徴と一致し、ベースラインSNOT-22、CT/内視鏡の重症度、ポリープの表現型、およびフィソロジー/パインの複合性を繰り返し強調する。
再現性のある表からGenAI評価プロトコルとサブグループ分析を提供する。
GenAIは透明性を高め、意思決定を共有するための説明役として機能する。
関連論文リスト
- Glioblastoma Overall Survival Prediction With Vision Transformers [6.318465743962574]
グリオ芽腫は最も攻撃的で一般的な脳腫瘍の1つで、生存期間は10~15ヶ月である。
本研究では,MRI画像を用いた総合生存(OS)予測のための新しい人工知能(AI)手法を提案する。
我々は視覚変換器(ViT)を用いてMRI画像から直接隠れた特徴を抽出し,腫瘍のセグメンテーションの必要性を排除した。
提案したモデルは、BRATSデータセットで評価され、テストセット上で62.5%の精度を達成した。
論文 参考訳(メタデータ) (2025-08-04T13:59:57Z) - SurgeryLSTM: A Time-Aware Neural Model for Accurate and Explainable Length of Stay Prediction After Spine Surgery [44.119171920037196]
選択的脊椎手術における滞在時間(LOS)予測のための機械学習モデルの開発と評価を行った。
我々は,従来のMLモデルと,マスク付き双方向長短期記憶(BiLSTM)であるオペレーショナルLSTMを比較した。
決定係数(R2)を用いて性能を評価し,説明可能なAIを用いて鍵予測器を同定した。
論文 参考訳(メタデータ) (2025-07-15T01:18:28Z) - Predicting Postoperative Stroke in Elderly SICU Patients: An Interpretable Machine Learning Model Using MIMIC Data [0.0]
高齢者集中治療室(SICU)患者における術後脳卒中は重要な合併症である。
我々はMIMIC-IIIデータベースとMIMIC-IVデータベースから19,085名の高齢者SICU入院を併用したコホートを構築した。
最初の24時間集中治療室滞在からの臨床データを用いて,院内脳卒中を予測するための解釈可能な機械学習フレームワークを開発した。
論文 参考訳(メタデータ) (2025-06-02T22:53:12Z) - Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Artificial Intelligence-Based Triaging of Cutaneous Melanocytic Lesions [0.8864540224289991]
患者数の増加とより包括的な診断の必要性により、病理学者は作業負荷の増大に直面している。
われわれは,全スライド画像に基づいて皮膚メラノサイト性病変をトリアージする人工知能(AI)モデルを開発した。
論文 参考訳(メタデータ) (2024-10-14T13:49:04Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Multi-Scale Hybrid Vision Transformer for Learning Gastric Histology:
AI-Based Decision Support System for Gastric Cancer Treatment [50.89811515036067]
胃内視鏡検査は、早期に適切な胃癌(GC)治療を判定し、GC関連死亡率を低下させる有効な方法である。
本稿では,一般のGC治療指導と直接一致する5つのGC病理のサブ分類を可能にする実用的なAIシステムを提案する。
論文 参考訳(メタデータ) (2022-02-17T08:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。