論文の概要: Domain-Adapted Small Language Models for Reliable Clinical Triage
- arxiv url: http://arxiv.org/abs/2604.26766v1
- Date: Wed, 29 Apr 2026 15:00:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.449179
- Title: Domain-Adapted Small Language Models for Reliable Clinical Triage
- Title(参考訳): 信頼性試験のためのドメイン適応型小言語モデル
- Authors: Manar Aljohani, Brandon Ho, Kenneth McKinley, Dennis Ren, Xuan Wang,
- Abstract要約: 本研究では、オープンソースの小言語モデル(SLM)が、臨床トリアージのための信頼性とプライバシー保護のための意思決定支援ツールとして機能するかどうかを評価する。
- 参考スコア(独自算出の注目度): 4.836986736624673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and consistent Emergency Severity Index (ESI) assignment remains a persistent challenge in emergency departments, where highly variable free-text triage documentation contributes to mistriage and workflow inefficiencies. This study evaluates whether open-source small language models (SLMs) can serve as reliable, privacy-preserving decision-support tools for clinical triage. We systematically compared multiple SLMs across diverse prompting pipelines and found that clinical vignettes, concise summaries of triage narratives, yielded the most accurate predictions. The SLM, Qwen2.5-7B, demonstrated the strongest balance of accuracy, stability, and computational efficiency. Through large-scale domain adaptation using expert-curated and silver-standard pediatric triage data, fine-tuned Qwen2.5-7B models substantially reduced discordance and clinically significant errors, outperforming all baseline SLMs and advanced proprietary large language models (LLMs, e.g., GPT-4o). These findings highlight the feasibility of institution-specific SLMs for reliable, privacy-preserving ESI decision support and underscore the importance of targeted fine-tuning over more complex inference strategies.
- Abstract(参考訳): 正確で一貫した緊急度指数(ESI)の割り当ては、非常に可変な自由テキストトリアージの文書がミストリアージやワークフローの非効率に寄与する緊急部署において、引き続き永続的な課題である。
本研究では、オープンソースの小言語モデル(SLM)が、臨床トリアージのための信頼性とプライバシー保護のための意思決定支援ツールとして機能するかどうかを評価する。
各種パイプラインの複数のSLMを系統的に比較したところ,臨床ヴィグネット,トリアージ物語の簡潔な要約から,最も正確な予測が得られた。
SLM、Qwen2.5-7Bは精度、安定性、計算効率の最も高いバランスを示した。
Qwen2.5-7Bモデルでは, 専門的・銀標準の医用トリアージデータを用いた大規模ドメイン適応により, 不一致と臨床的に有意な誤差を著しく低減し, 全ベースラインのSLMと高度プロプライエタリな大規模言語モデル(LLMs, eg, GPT-4o)より優れていた。
これらの知見は,ESI意思決定支援の信頼性とプライバシ保護のための機関固有のSLMの実現可能性を明らかにするとともに,より複雑な推論戦略よりも,目標とする微調整の重要性を浮き彫りにした。
関連論文リスト
- Dynamic Summary Generation for Interpretable Multimodal Depression Detection [23.358673852385337]
スティグマと主観的症状が信頼できるスクリーニングを妨げているため、うつ病は広く診断され治療されていない。
本稿では,大規模言語モデルを用いて高精度かつ解釈可能な検出を行う,粗大なマルチステージフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-13T11:34:40Z) - Is Clinical Text Enough? A Multimodal Study on Mortality Prediction in Heart Failure Patients [1.6784199253342376]
心不全コホートを用いたトランスフォーマーモデルの評価を行った。
臨床テキストをエンティティレベルの表現で豊かにすることで,CLS埋め込みのみによる予測が向上することを示す。
大規模な言語モデルは、モダリティやデコード戦略に一貫性がない。
論文 参考訳(メタデータ) (2026-04-02T11:41:36Z) - DISCO-TAB: A Hierarchical Reinforcement Learning Framework for Privacy-Preserving Synthesis of Complex Clinical Data [2.3915781021862332]
DISCO-TABは、Reinforcement Learningによって最適化された多目的識別器システムを用いて、微調整LDMをオーケストレーションする新しいフレームワークである。
私たちは、高次元の小さな医療データセットを含むさまざまなベンチマークで、私たちのフレームワークを厳格に検証しています。
以上の結果から, 階層的フィードバックは最先端の成果をもたらすことが示され, 下流の臨床的有用性は最大38.2%向上した。
論文 参考訳(メタデータ) (2026-04-01T23:37:58Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Investigating the Multilingual Calibration Effects of Language Model Instruction-Tuning [58.355275813623685]
本研究は,多言語設定における大規模言語モデル(LLM)の校正における重要なギャップについて考察する。
低リソース言語であっても、高リソース言語SFTデータセットのインストラクションチューニング後にモデルの信頼性が著しく向上する可能性がある。
しかし、精度の改善は限界的あるいは存在しないものであり、多言語言語における標準SFTの重大な欠点を浮き彫りにしている。
論文 参考訳(メタデータ) (2026-01-04T04:29:12Z) - Self-Correction Distillation for Structured Data Question Answering [50.98882432829651]
小型言語モデル(LLM)は、構造化クエリの生成時にエラーを起こしやすい。
小型LCMの構造データQA能力を向上させるための自己補正蒸留(SCD)法を提案する。
論文 参考訳(メタデータ) (2025-11-11T09:01:51Z) - OncoReason: Structuring Clinical Reasoning in LLMs for Robust and Interpretable Survival Prediction [2.904892426557913]
大規模言語モデル (LLM) は, バイオメディカルNLPにおいて高い性能を示した。
本稿では,自己回帰型LPMと結果予測のための臨床推論を整合させる,統合型マルチタスク学習フレームワークを提案する。
マルチタスク・クリニカル・モデリングにおける推論・アライメントの重要性について検討した。
論文 参考訳(メタデータ) (2025-10-20T13:35:12Z) - LLM-Assisted Emergency Triage Benchmark: Bridging Hospital-Rich and MCI-Like Field Simulation [0.0]
劣化予測のためのLCM支援緊急トリアージベンチマークをオープンに導入する。
i)バイタル、実験室、ノート、主要な苦情、構造化された観察を伴う病院に富んだ設定、(ii)バイタル、観察、ノートに限定されたMCIライクなフィールドシミュレーションである。
論文 参考訳(メタデータ) (2025-09-30T14:54:58Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。