論文の概要: Classification of kinetic-related injury in hospital triage data using NLP
- arxiv url: http://arxiv.org/abs/2509.04969v1
- Date: Fri, 05 Sep 2025 09:49:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.55551
- Title: Classification of kinetic-related injury in hospital triage data using NLP
- Title(参考訳): NLPを用いた病院トリアージデータにおける運動性障害の分類
- Authors: Midhun Shyam, Jim Basilakis, Kieran Luken, Steven Thomas, John Crozier, Paul M. Middleton, X. Rosalind Wang,
- Abstract要約: トリアージノートには、プライバシー規制の対象となる非常に機密性の高い情報が含まれている。
ほとんどの病院や医療施設は、大規模言語モデルを微調整するために必要なハードウェアを欠いている。
LLMと限られた計算資源を用いたトリアージデータの分類を可能にするパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Triage notes, created at the start of a patient's hospital visit, contain a wealth of information that can help medical staff and researchers understand Emergency Department patient epidemiology and the degree of time-dependent illness or injury. Unfortunately, applying modern Natural Language Processing and Machine Learning techniques to analyse triage data faces some challenges: Firstly, hospital data contains highly sensitive information that is subject to privacy regulation thus need to be analysed on site; Secondly, most hospitals and medical facilities lack the necessary hardware to fine-tune a Large Language Model (LLM), much less training one from scratch; Lastly, to identify the records of interest, expert inputs are needed to manually label the datasets, which can be time-consuming and costly. We present in this paper a pipeline that enables the classification of triage data using LLM and limited compute resources. We first fine-tuned a pre-trained LLM with a classifier using a small (2k) open sourced dataset on a GPU; and then further fine-tuned the model with a hospital specific dataset of 1000 samples on a CPU. We demonstrated that by carefully curating the datasets and leveraging existing models and open sourced data, we can successfully classify triage data with limited compute resources.
- Abstract(参考訳): 患者の病院訪問の開始時に作成されたトリアージノートには、医療スタッフや研究者が救急病の疫学や時間依存疾患や怪我の程度を理解するのに役立つ豊富な情報が含まれている。
残念なことに、トリアージデータを分析するために現代の自然言語処理と機械学習技術を適用するには、いくつかの課題に直面している。 まず、病院のデータには、プライバシー規制の対象となっている非常に機密性の高い情報が含まれているため、サイト上で分析する必要がある。
本稿では,LLMと限られた計算資源を用いたトリアージデータの分類を可能にするパイプラインを提案する。
まず、GPU上の小さな(2k)オープンソースデータセットを使用して分類器で事前訓練されたLLMを微調整し、さらに、CPU上の1000サンプルの病院固有のデータセットでモデルを微調整した。
我々は、データセットを慎重にキュレートし、既存のモデルとオープンソースデータを活用することで、限られた計算リソースでトリアージデータを分類できることを示した。
関連論文リスト
- A text-to-tabular approach to generate synthetic patient data using LLMs [0.3628457733531155]
そこで本研究では,患者データへのアクセスを必要としない人工的な患者データを生成する手法を提案する。
我々は,大言語モデルの先行医療知識とコンテキスト内学習能力を活用して,現実的な患者データを生成する。
論文 参考訳(メタデータ) (2024-12-06T16:10:40Z) - Multimodal Pretraining of Medical Time Series and Notes [45.89025874396911]
ディープラーニングモデルは、意味のあるパターンを抽出する際の約束を示すが、広範囲なラベル付きデータが必要である。
本稿では,臨床測定値とノートのアライメントに着目し,自己指導型事前学習を用いた新しいアプローチを提案する。
病院内での死亡予測や表現型化などの下流タスクでは、データのごく一部がラベル付けされた設定において、ベースラインよりも優れています。
論文 参考訳(メタデータ) (2023-12-11T21:53:40Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - FLOP: Federated Learning on Medical Datasets using Partial Networks [84.54663831520853]
新型コロナウイルスの感染拡大で医療資源が不足している。
新型コロナウイルスの診断を緩和するために、さまざまなデータ駆動型ディープラーニングモデルが開発されている。
患者のプライバシー上の懸念から、データそのものはまだ乏しい。
我々は、textbfPartial Networks (FLOP) を用いた、シンプルで効果的な textbfFederated textbfL textbfon Medical データセットを提案する。
論文 参考訳(メタデータ) (2021-02-10T01:56:58Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。