論文の概要: Development and Comparative Evaluation of Three Artificial Intelligence Models (NLP, LLM, JEPA) for Predicting Triage in Emergency Departments: A 7-Month Retrospective Proof-of-Concept
- arxiv url: http://arxiv.org/abs/2507.01080v1
- Date: Tue, 01 Jul 2025 16:37:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.841625
- Title: Development and Comparative Evaluation of Three Artificial Intelligence Models (NLP, LLM, JEPA) for Predicting Triage in Emergency Departments: A 7-Month Retrospective Proof-of-Concept
- Title(参考訳): 救急部門におけるトリアージ予測のための3つの人工知能モデル(NLP, LLM, JEPA)の開発と比較評価:7ヶ月のレトロスペクティブによる概念実証
- Authors: Edouard Lansiaux, Ramy Azzouz, Emmanuel Chazard, Amélie Vromant, Eric Wiel,
- Abstract要約: 救急部門(EDs)における過度な取締りや過度な取締りを含むトリアージエラーは永続的な課題である
本研究は、FRENCH尺度と臨床実践に対するトリアージ結果の予測における3つのAIモデルの性能を比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Triage errors, including undertriage and overtriage, are persistent challenges in emergency departments (EDs). With increasing patient influx and staff shortages, the integration of artificial intelligence (AI) into triage protocols has gained attention. This study compares the performance of three AI models [Natural Language Processing (NLP), Large Language Models (LLM), and Joint Embedding Predictive Architecture (JEPA)] in predicting triage outcomes against the FRENCH scale and clinical practice.We conducted a retrospective analysis of a prospectively recruited cohort gathering adult patient triage data over a 7-month period at the Roger Salengro Hospital ED (Lille, France). Three AI models were trained and validated : (1) TRIAGEMASTER (NLP), (2) URGENTIAPARSE (LLM), and (3) EMERGINET (JEPA). Data included demographic details, verbatim chief complaints, vital signs, and triage outcomes based on the FRENCH scale and GEMSA coding. The primary outcome was the concordance of AI-predicted triage level with the FRENCH gold-standard. It was assessed thanks to various indicators : F1-Score, Weighted Kappa, Spearman, MAE, RMSE. The LLM model (URGENTIAPARSE) showed higher accuracy (composite score: 2.514) compared to JEPA (EMERGINET, 0.438) and NLP (TRIAGEMASTER, -3.511), outperforming nurse triage (-4.343). Secondary analyses highlighted the effectiveness of URGENTIAPARSE in predicting hospitalization needs (GEMSA) and its robustness with structured data versus raw transcripts (either for GEMSA prediction or for FRENCH prediction). LLM architecture, through abstraction of patient representations, offers the most accurate triage predictions among tested models. Integrating AI into ED workflows could enhance patient safety and operational efficiency, though integration into clinical workflows requires addressing model limitations and ensuring ethical transparency.
- Abstract(参考訳): 救急部門(EDs)では、下降や過度な取締りを含むトリアージエラーが持続的な課題である。
患者流入の増加とスタッフ不足により、人工知能(AI)のトリアージプロトコルへの統合が注目されている。
本研究は,3つのAIモデル(NLP,Large Language Processing,LLM,Joint Embedding Predictive Architecture,JEPA)の性能をFRENCHスケールに対するトリアージ結果の予測と臨床実践と比較し,Roger Salengro Hospital ED (Lille, France) で7カ月間,有望に募集された成人患者トリアージデータの振り返り分析を行った。
1) TRIAGEMASTER (NLP), (2) URGENTIAPARSE (LLM), (3) EMERGINET (JEPA) の3つのAIモデルを訓練・検証した。
データには、FRENCH尺度とGEMSA符号に基づく人口統計の詳細、口頭弁論の主訴、バイタルサイン、トリアージ結果が含まれていた。
主な成果は、AI予測トリアージレベルとFRENCHゴールド標準との一致であった。
F1-Score、Weighted Kappa、Spearman、MAE、RMSEなどによって評価された。
LLMモデル (URGENTIAPARSE) はJEPA (EMERGINET, 0.438) とNLP (TRIAGEMASTER, -3.511) と比較して高い精度 (2.514) を示した。
二次分析では,入院ニーズ予測(GEMSA)におけるURGENTIAPARSEの有効性と,構造化データと生文書との堅牢性(GEMSA予測かFRENCH予測か)を強調した。
LLMアーキテクチャは、患者表現の抽象化を通じて、テストされたモデル間で最も正確なトリアージ予測を提供する。
EDワークフローにAIを統合することで患者の安全性と運用効率が向上するが、臨床ワークフローに統合するにはモデルの制限に対処し、倫理的透明性を確保する必要がある。
関連論文リスト
- Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Enhancing End Stage Renal Disease Outcome Prediction: A Multi-Sourced Data-Driven Approach [7.212939068975618]
10,326人のCKD患者のデータを利用して,2009年から2018年までの臨床とクレーム情報を組み合わせた。
24ヶ月の観測窓は早期検出と予測精度のバランスをとるのに最適であると同定された。
2021年のeGFR方程式は予測精度を改善し、特にアフリカ系アメリカ人の偏見を低減した。
論文 参考訳(メタデータ) (2024-10-02T03:21:01Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Transformer-based unsupervised patient representation learning based on
medical claims for risk stratification and analysis [3.5492837081144204]
トランスフォーマーベースのマルチモーダルオートエンコーダ(TMAE)は,クレームデータから有意義な情報を符号化することで,効率的な患者表現を学習することができる。
我々は,60,000人以上の患者を対象とする実世界の小児検診データセットを用いてTMAEを訓練した。
論文 参考訳(メタデータ) (2021-06-23T21:29:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。