論文の概要: CLIN-LLM: A Safety-Constrained Hybrid Framework for Clinical Diagnosis and Treatment Generation
- arxiv url: http://arxiv.org/abs/2510.22609v1
- Date: Sun, 26 Oct 2025 10:11:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.293891
- Title: CLIN-LLM: A Safety-Constrained Hybrid Framework for Clinical Diagnosis and Treatment Generation
- Title(参考訳): CLIN-LLM : 臨床診断と治療のための安全制約付きハイブリッドフレームワーク
- Authors: Md. Mehedi Hasan, Rafid Mostafiz, Md. Abir Hossain, Bikash Kumar Paul,
- Abstract要約: LLM(Large Language Model)ベースのシステムは、しばしば医学的な根拠がなく、不確実性を定量化できない。
CLIN-LLMは,マルチモーダル患者エンコーディング,不確実性校正疾患分類,検索・拡張治療生成を統合した安全拘束型ハイブリッドパイプラインである。
- 参考スコア(独自算出の注目度): 0.31984926651189866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate symptom-to-disease classification and clinically grounded treatment recommendations remain challenging, particularly in heterogeneous patient settings with high diagnostic risk. Existing large language model (LLM)-based systems often lack medical grounding and fail to quantify uncertainty, resulting in unsafe outputs. We propose CLIN-LLM, a safety-constrained hybrid pipeline that integrates multimodal patient encoding, uncertainty-calibrated disease classification, and retrieval-augmented treatment generation. The framework fine-tunes BioBERT on 1,200 clinical cases from the Symptom2Disease dataset and incorporates Focal Loss with Monte Carlo Dropout to enable confidence-aware predictions from free-text symptoms and structured vitals. Low-certainty cases (18%) are automatically flagged for expert review, ensuring human oversight. For treatment generation, CLIN-LLM employs Biomedical Sentence-BERT to retrieve top-k relevant dialogues from the 260,000-sample MedDialog corpus. The retrieved evidence and patient context are fed into a fine-tuned FLAN-T5 model for personalized treatment generation, followed by post-processing with RxNorm for antibiotic stewardship and drug-drug interaction (DDI) screening. CLIN-LLM achieves 98% accuracy and F1 score, outperforming ClinicalBERT by 7.1% (p < 0.001), with 78% top-5 retrieval precision and a clinician-rated validity of 4.2 out of 5. Unsafe antibiotic suggestions are reduced by 67% compared to GPT-5. These results demonstrate CLIN-LLM's robustness, interpretability, and clinical safety alignment. The proposed system provides a deployable, human-in-the-loop decision support framework for resource-limited healthcare environments. Future work includes integrating imaging and lab data, multilingual extensions, and clinical trial validation.
- Abstract(参考訳): 特に診断リスクの高い異種患者では, 正確な症状と症状の分類, 臨床的根拠による治療勧告は依然として困難である。
既存の大規模言語モデル(LLM)ベースのシステムは医療基盤を欠いていることが多く、不確実性を定量化できないため、出力が安全でない。
CLIN-LLMは,マルチモーダル患者エンコーディング,不確実性校正疾患分類,検索・拡張治療生成を統合した安全拘束型ハイブリッドパイプラインである。
The framework fine-tunes BioBERT on 1,200 Clinical Case from the Symptom2Disease dataset and integrates Focal Loss with Monte Carlo Dropout to enable confidence-aware predictions from free-text symptoms and structured vitals。
低確実性のケース(18%)は、専門家のレビューのために自動的にフラグ付けされ、人間の監視が保証される。
治療生成のためにCLIN-LLMはBiomedical Sentence-BERTを使用して、26万サンプルのMedDialog corpusからトップk関連対話を検索する。
検索されたエビデンスと患者コンテキストは、パーソナライズされた治療生成のための微調整されたFLAN-T5モデルに入力され、その後RxNormで抗生物質のスチュワードシップとドラッグ・ドラッグ・インタラクション(DDI)スクリーニングを行う。
CLIN-LLMの精度は98%,F1スコアは7.1%(p<0。
安全性の低い抗生物質は、GPT-5と比較して67%減少する。
これらの結果から,CLIN-LLMの堅牢性,解釈可能性,臨床安全アライメントが示唆された。
提案システムは、リソース制限された医療環境に対して、デプロイ可能な、ループ内意思決定支援フレームワークを提供する。
今後の開発には、画像と実験室のデータの統合、多言語拡張、臨床試験の検証が含まれる。
関連論文リスト
- A Fully Automatic Framework for Intracranial Pressure Grading: Integrating Keyframe Identification, ONSD Measurement and Clinical Data [3.6652537579778106]
頭蓋内圧(ICP)上昇は脳機能に深刻な脅威をもたらし、時間的介入の監視を必要とする。
OnSD測定と臨床データを統合したICPグレーティングのための完全自動2段階フレームワークを提案する。
評価精度は0.845 pm 0.071$, 独立試験精度0.786であり, 従来のしきい値法よりも優れていた。
論文 参考訳(メタデータ) (2025-09-11T11:37:48Z) - A Narrative-Driven Computational Framework for Clinician Burnout Surveillance [0.5281694565226512]
臨床医のバーンアウトは、特にICU(High-acuity intensive care Unit)において、患者の安全に重大な脅威をもたらす
本研究では,Beth Israel Deaconess Medical Centerの電子健康記録から得られたMIMIC-IVから,1万 ICU放電サマリーを解析した。
このデータセットは、バイタルサイン、医療命令、診断、処置、治療、特定自由テキスト臨床ノートを含む多様な患者データを含んでいる。
論文 参考訳(メタデータ) (2025-09-01T19:05:26Z) - Organ-Agents: Virtual Human Physiology Simulator via LLMs [66.40796430669158]
オルガン-エージェント(Organ-Agents)は、LDM駆動のエージェントを介して人間の生理学をシミュレートする多エージェントフレームワークである。
症例は7,134例,コントロール7,895例で,9系統および125変数にわたる高分解能トラジェクトリを作成した。
臓器抗原は4,509人の保留患者に対して高いシミュレーション精度を達成し, システムごとのMSE0.16とSOFA系重症度層間の堅牢性を示した。
論文 参考訳(メタデータ) (2025-08-20T01:58:45Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z) - Simulated patient systems are intelligent when powered by large language model-based AI agents [32.73072809937573]
我々は,大規模言語モデルに基づくAIエージェントを用いた,インテリジェントシミュレートされた患者システムAIatientを開発した。
このシステムにはRetrieval Augmented Generationフレームワークが組み込まれており、複雑な推論のために6つのタスク固有のLLMベースのAIエージェントが使用されている。
シミュレーションの現実のために、このシステムはAIPatient KG (Knowledge Graph) も利用している。
論文 参考訳(メタデータ) (2024-09-27T17:17:15Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Clinical Outcome Prediction from Admission Notes using Self-Supervised
Knowledge Integration [55.88616573143478]
臨床テキストからのアウトカム予測は、医師が潜在的なリスクを見落としないようにする。
退院時の診断,手術手順,院内死亡率,長期予測は4つの一般的な結果予測対象である。
複数の公開資料から得られた患者結果に関する知識を統合するために,臨床結果の事前学習を提案する。
論文 参考訳(メタデータ) (2021-02-08T10:26:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。