論文の概要: Development and Preliminary Evaluation of a Domain-Specific Large Language Model for Tuberculosis Care in South Africa
- arxiv url: http://arxiv.org/abs/2604.19776v1
- Date: Sat, 28 Mar 2026 11:22:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.068082
- Title: Development and Preliminary Evaluation of a Domain-Specific Large Language Model for Tuberculosis Care in South Africa
- Title(参考訳): 南アフリカにおける結核治療のためのドメイン特化大言語モデルの開発と予備的評価
- Authors: Thokozile Khosa, Olawande Daramola,
- Abstract要約: 本稿では,TBケアのためのドメイン固有大規模言語モデル(DS-LLM)の開発について実験的に検討する。
データは南アフリカのTBガイドライン、選択されたTB文献、既存のベンチマーク医学データセットから収集された。
DS-LLMは、コンテキストアライメントの観点から、ベースモデルよりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Tuberculosis (TB) is one of the world's deadliest infectious diseases, and in South Africa, it contributes a significant burden to the country's health care system. This paper presents an experimental study on the development of a domain-specific Large Language Model (DS-LLM) for TB care that can help to alleviate the burden on patients and healthcare providers. To achieve this, a literature review was conducted to understand current LLM development strategies, specifically in the medical domain. Thereafter, data were collected from South African TB guidelines, selected TB literature, and existing benchmark medical datasets. We performed LLM fine-tuning by using the Quantised Low-Rank Adaptation (QLoRA) algorithm on a medical LLM (BioMistral-7B), and also implemented Retrieval-Augmented Generation using GraphRAG. The developed DS-LLM was evaluated against the base BioMistral-7B model and a general-purpose LLM using a mix of automated metrics and quantitative ratings. The results show that the DS-LLM had better performance compared to the base model in terms of its contextual alignment (lexical, semantic, and knowledge) for TB care in South Africa.
- Abstract(参考訳): 結核(TB)は世界で最も致命的な感染症の1つであり、南アフリカでは同国の医療システムに大きな負担がかかる。
本稿では,患者や医療提供者の負担を軽減するため,TBケアのためのドメイン固有言語モデル(DS-LLM)の開発について実験的に検討する。
これを実現するため,医学領域における現在のLCM開発戦略を理解するために文献レビューを行った。
その後、南アフリカのTBガイドライン、選択されたTB文献、既存のベンチマーク医学データセットからデータを収集した。
医療用LLM (BioMistral-7B) 上で, QLoRAアルゴリズムを用いてLLMの微調整を行い, また, GraphRAGを用いたRetrieval-Augmented Generationを実装した。
The developed DS-LLM was evaluation on the base BioMistral-7B model and a general-purpose LLM using a mix of automated metrics and metric ratings。
その結果,DS-LLMは,南アフリカにおけるTBケアの文脈的アライメント(語彙的,意味的,知識的アライメント)において,ベースモデルよりも優れた性能を示した。
関連論文リスト
- EviCare: Enhancing Diagnosis Prediction with Deep Model-Guided Evidence for In-Context Reasoning [62.61394722212386]
EviCareは、大規模言語モデルにディープモデルガイダンスを統合する、コンテキスト内推論フレームワークである。
LLMのみのベースラインと深層モデルのみのベースラインを2つの実世界のEHRベンチマークで連続的に上回っている。
論文 参考訳(メタデータ) (2026-04-12T04:35:14Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Mind the Gap: Evaluating the Representativeness of Quantitative Medical Language Reasoning LLM Benchmarks for African Disease Burdens [0.609562679184219]
既存のLCMベンチマークでは、高い所得設定による検査シラビと疾患プロファイルを主に反映している。
Alama Health QAはケニアのクリニカル・クリニカル・プラクティス・ガイドラインに固定された検索拡張生成フレームワークを用いて開発された。
アラマは関連性およびガイドラインアライメントで最高であり、PubMedQAは臨床的有用性で最低であった。
論文 参考訳(メタデータ) (2025-07-22T08:05:30Z) - CRAB: A Benchmark for Evaluating Curation of Retrieval-Augmented LLMs in Biomedicine [3.1427813443719868]
バイオメディシン(CRAB)における検索用LLMのキュレーションのベンチマークについて紹介する。
CRABは、検索拡張LDMの生体医学的キュレーションを評価するための最初の多言語ベンチマークである。
CRABは、新しい引用に基づく評価基準を組み込むことで、バイオメディシンにおける検索増強LDMのキュレーション性能を定量化する。
論文 参考訳(メタデータ) (2025-04-15T07:25:40Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - LLMs-in-the-loop Part-1: Expert Small AI Models for Bio-Medical Text Translation [0.0]
本研究では,医療用テキストに最適化された教師ありニューラルマシン翻訳モデルを開発するために,新しい"LLMs-in-the-loop"アプローチを提案する。
6つの言語での独自の平行コーパスは、科学論文、人工的に生成された臨床文書、医療文書から編纂された。
MarianMTベースのモデルは、Google Translate、DeepL、GPT-4-Turboより優れている。
論文 参考訳(メタデータ) (2024-07-16T19:32:23Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Evaluating Large Language Models for Radiology Natural Language
Processing [68.98847776913381]
大規模言語モデル(LLM)の台頭は、自然言語処理(NLP)分野における重要な転換点となっている。
本研究は, 放射線学報告の解釈において, 30 個の LLM を批判的に評価することにより, このギャップを埋めることを目指している。
論文 参考訳(メタデータ) (2023-07-25T17:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。