論文の概要: Accelerating Clinical NLP at Scale with a Hybrid Framework with Reduced GPU Demands: A Case Study in Dementia Identification
- arxiv url: http://arxiv.org/abs/2504.12494v1
- Date: Wed, 16 Apr 2025 21:24:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-26 02:11:00.939648
- Title: Accelerating Clinical NLP at Scale with a Hybrid Framework with Reduced GPU Demands: A Case Study in Dementia Identification
- Title(参考訳): GPU需要を低減したハイブリッドフレームワークによる大規模臨床NLPの高速化:認知症鑑定を事例として
- Authors: Jianlin Shi, Qiwei Gan, Elizabeth Hanchrow, Annie Bowles, John Stanley, Adam P. Bress, Jordana B. Cohen, Patrick R. Alba,
- Abstract要約: 本稿では,ルールベースのフィルタリング,サポートベクトルマシン(SVM)分類器,BERTモデルを統合するハイブリッドNLPフレームワークを提案する。
我々はこの枠組みを、重篤な高血圧を持つ490万人の退役軍人の認知症鑑定ケーススタディに応用し、210億の臨床記録を分析した。
- 参考スコア(独自算出の注目度): 0.12369842801624054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical natural language processing (NLP) is increasingly in demand in both clinical research and operational practice. However, most of the state-of-the-art solutions are transformers-based and require high computational resources, limiting their accessibility. We propose a hybrid NLP framework that integrates rule-based filtering, a Support Vector Machine (SVM) classifier, and a BERT-based model to improve efficiency while maintaining accuracy. We applied this framework in a dementia identification case study involving 4.9 million veterans with incident hypertension, analyzing 2.1 billion clinical notes. At the patient level, our method achieved a precision of 0.90, a recall of 0.84, and an F1-score of 0.87. Additionally, this NLP approach identified over three times as many dementia cases as structured data methods. All processing was completed in approximately two weeks using a single machine with dual A40 GPUs. This study demonstrates the feasibility of hybrid NLP solutions for large-scale clinical text analysis, making state-of-the-art methods more accessible to healthcare organizations with limited computational resources.
- Abstract(参考訳): 臨床自然言語処理(NLP)は、臨床研究と手術の双方においてますます需要が高まっている。
しかし、最先端のソリューションのほとんどはトランスフォーマーベースであり、高い計算資源を必要とし、アクセシビリティを制限している。
本稿では,ルールベースのフィルタリング,サポートベクトルマシン(SVM)分類器,BERTモデルを統合するハイブリッドNLPフレームワークを提案する。
我々はこの枠組みを、重篤な高血圧を持つ490万人の退役軍人の認知症鑑定ケーススタディに応用し、210億の臨床記録を分析した。
患者レベルでは精度0.90,リコール0.84,F1スコア0.87が得られた。
さらに、このNLPアプローチは、構造化データ手法の3倍以上の認知症の症例を同定した。
全処理は約2週間で、デュアルA40 GPUを搭載した1台のマシンで完了した。
本研究は,大規模臨床テキスト分析のためのハイブリッドNLPソリューションの実現可能性を示す。
関連論文リスト
- Beyond Negation Detection: Comprehensive Assertion Detection Models for Clinical NLP [5.297964922424743]
我々は最先端のアサーション検出モデルを開発する。
我々はこれらのモデルを,クラウドベースの商用APIソリューション,レガシルールベースのNegExアプローチ,GPT-4oに対して評価する。
論文 参考訳(メタデータ) (2025-03-21T10:18:47Z) - Can Zero-Shot Commercial APIs Deliver Regulatory-Grade Clinical Text DeIdentification? [4.769069757504856]
John Snow Labsの医療言語モデルソリューションは、最高の精度を達成する。
AzureやGPT-4oに比べて80%以上安く、トークンによる価格設定ができない唯一のソリューションである。
論文 参考訳(メタデータ) (2025-03-21T10:05:04Z) - Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [48.87360916431396]
MedR-Benchは1,453例の構造化患者のベンチマークデータセットで、推論基準を付した注釈付きである。
本稿では,3つの批判的診察勧告,診断決定,治療計画を含む枠組みを提案し,患者のケアジャーニー全体をシミュレートする。
このベンチマークを用いて、DeepSeek-R1、OpenAI-o3-mini、Gemini-2.0-Flash Thinkingなど、最先端の5つのLCMを評価した。
論文 参考訳(メタデータ) (2025-03-06T18:35:39Z) - Efficient Brain Tumor Classification with Lightweight CNN Architecture: A Novel Approach [0.0]
MRI画像を用いた脳腫瘍の分類は、早期かつ正確な検出が患者の予後に大きな影響を及ぼす医療診断において重要である。
近年のディープラーニング(DL)の進歩は将来性を示しているが、多くのモデルは精度と計算効率のバランスに苦慮している。
本稿では,分離可能な畳み込みと圧縮・励振ブロック(SEブロック)を統合した新しいモデルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-01T21:06:42Z) - A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0]
Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-12-13T12:47:30Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Deep learning in computed tomography pulmonary angiography imaging: a
dual-pronged approach for pulmonary embolism detection [0.0]
本研究の目的は,深層学習技術を活用し,肺塞栓症(PE)のコンピュータ支援診断(CAD)を強化することである。
我々の分類システムは、注意機構を用いて局所的な文脈を利用する注意誘導畳み込みニューラルネットワーク(AG-CNN)を含む。
AG-CNNはFUMPEデータセット上で堅牢なパフォーマンスを実現し、AUROCは0.927、感度は0.862、特異性は0.879、F1スコアは0.805、Inception-v3バックボーンアーキテクチャは0.805である。
論文 参考訳(メタデータ) (2023-11-09T08:23:44Z) - The Power Of Simplicity: Why Simple Linear Models Outperform Complex
Machine Learning Techniques -- Case Of Breast Cancer Diagnosis [0.0]
本研究では,乳がん診断における単純な線形モデルと複雑な機械学習技術の有効性について検討した。
UCI Machine Learning Repositoryデータセットを用いて,ロジスティック回帰(LR),決定木(DT),サポートベクトルマシン(SVM)のパフォーマンスを最適化する。
より単純な線形モデルであるLRは、テストスコア平均97.28%、標準偏差1.62%、計算時間35.56msにおいて、より複雑なDTおよびSVM技術よりも優れていることを示した。
論文 参考訳(メタデータ) (2023-06-04T19:43:54Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - Dynamic Bank Learning for Semi-supervised Federated Image Diagnosis with
Class Imbalance [65.61909544178603]
クラス不均衡半教師付きFL(imFed-Semi)の実用的かつ困難な問題について検討する。
このImFed-Semi問題は、クラス比例情報を利用してクライアントトレーニングを改善する新しい動的銀行学習方式によって解決される。
25,000個のCTスライスによる頭蓋内出血診断と10,015個の皮膚内視鏡画像による皮膚病変診断の2つの公開実世界の医療データセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-06-27T06:51:48Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - An Integrated Optimization and Machine Learning Models to Predict the
Admission Status of Emergency Patients [1.0323063834827415]
T-XGB、T-ADAB、T-MLPの3つの機械学習アルゴリズムが提案されている。
提案フレームワークは,患者搭乗プロセスを積極的に計画することにより,混雑を緩和することができる。
その結果,新たに提案したアルゴリズムはAUCが高く,従来のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-02-18T13:50:44Z) - Performance of Dual-Augmented Lagrangian Method and Common Spatial
Patterns applied in classification of Motor-Imagery BCI [68.8204255655161]
運動画像に基づく脳-コンピュータインタフェース(MI-BCI)は、神経リハビリテーションのための画期的な技術になる可能性がある。
使用する脳波信号のノイズの性質のため、信頼性の高いBCIシステムは特徴の最適化と抽出のために特別な手順を必要とする。
論文 参考訳(メタデータ) (2020-10-13T20:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。