論文の概要: LLaMA-XR: A Novel Framework for Radiology Report Generation using LLaMA and QLoRA Fine Tuning
- arxiv url: http://arxiv.org/abs/2506.03178v1
- Date: Thu, 29 May 2025 12:21:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.912548
- Title: LLaMA-XR: A Novel Framework for Radiology Report Generation using LLaMA and QLoRA Fine Tuning
- Title(参考訳): LLaMA-XR - LLaMAとQLoRAファインチューニングを用いた放射線学レポート作成のための新しいフレームワーク
- Authors: Md. Zihad Bin Jahangir, Muhammad Ashad Kabir, Sumaiya Akter, Israt Jahan, Minh Chau,
- Abstract要約: 我々は、LLaMA 3.1とDenseNet-121ベースのイメージ埋め込みと、QLoRA(Quantized Low-Rank Adaptation)の微調整を統合した新しいフレームワークであるLLaMA-XRを提案する。
LLaMA-XRは、計算効率を維持しつつ、コヒーレンスと臨床精度を向上させる。
- 参考スコア(独自算出の注目度): 0.807790317232093
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated radiology report generation holds significant potential to reduce radiologists' workload and enhance diagnostic accuracy. However, generating precise and clinically meaningful reports from chest radiographs remains challenging due to the complexity of medical language and the need for contextual understanding. Existing models often struggle with maintaining both accuracy and contextual relevance. In this paper, we present LLaMA-XR, a novel framework that integrates LLaMA 3.1 with DenseNet-121-based image embeddings and Quantized Low-Rank Adaptation (QLoRA) fine-tuning. LLaMA-XR achieves improved coherence and clinical accuracy while maintaining computational efficiency. This efficiency is driven by an optimization strategy that enhances parameter utilization and reduces memory overhead, enabling faster report generation with lower computational resource demands. Extensive experiments conducted on the IU X-ray benchmark dataset demonstrate that LLaMA-XR outperforms a range of state-of-the-art methods. Our model achieves a ROUGE-L score of 0.433 and a METEOR score of 0.336, establishing new performance benchmarks in the domain. These results underscore LLaMA-XR's potential as an effective and efficient AI system for automated radiology reporting, offering enhanced clinical utility and reliability.
- Abstract(参考訳): 自動放射線学レポート生成は、放射線科医の作業量を減らし、診断精度を高める重要な可能性を秘めている。
しかし,医学用語の複雑化と文脈理解の必要性から,胸部X線写真から正確な,臨床的意義のある報告を生成することは依然として困難である。
既存のモデルは、しばしば正確性と文脈的関連性の両方を維持するのに苦労する。
本稿では、LLaMA 3.1とDenseNet-121ベースの画像埋め込みと、QLoRA(Quantized Low-Rank Adaptation)ファインタニングを統合した新しいフレームワークであるLLaMA-XRを提案する。
LLaMA-XRは、計算効率を維持しつつ、コヒーレンスと臨床精度を向上させる。
この効率性は、パラメータ使用率を高め、メモリオーバーヘッドを低減する最適化戦略によって駆動され、より少ない計算リソース要求でより高速なレポート生成を可能にする。
IU X-rayベンチマークデータセットで実施された大規模な実験は、LLaMA-XRが最先端の手法よりも優れていることを示した。
本モデルでは, ROUGE-Lスコア0.433, METEORスコア0.336を達成し, 新たな性能ベンチマークを構築した。
これらの結果から,LLaMA-XRが自動放射線診断のための効率的かつ効率的なAIシステムとしての可能性を強調し,臨床応用と信頼性の向上を図った。
関連論文リスト
- Revolutionizing Radiology Workflow with Factual and Efficient CXR Report Generation [0.0]
本稿では,胸部X線自動生成に特化して開発されたLLM中心の基盤モデルであるCXR-PathFinderを紹介する。
本稿では,専門的な臨床フィードバックを相手の学習フレームワークに統合する,ユニークな訓練パラダイムであるCGAFTを提案する。
我々の実験は、CXR-PathFinderが、様々なメトリクスで既存の最先端の医療ビジョン言語モデルを大幅に上回っていることを実証した。
論文 参考訳(メタデータ) (2025-06-01T18:47:49Z) - Look & Mark: Leveraging Radiologist Eye Fixations and Bounding boxes in Multimodal Large Language Models for Chest X-ray Report Generation [2.821158017021184]
Look & Mark (L&M) は、放射線医学的アイフィクス(Look)とバウンディングボックスアノテーション(Mark)を統合した新しい接地固定戦略である。
LLaVA-OVは87.3%の臨床平均成績(C.AVG)を達成しており、L&Mとインコンテキストラーニングを組み合わせた汎用モデルもすべてのモデルの中で最高である。
論文 参考訳(メタデータ) (2025-05-28T10:54:40Z) - ChestX-Reasoner: Advancing Radiology Foundation Models with Reasoning through Step-by-Step Verification [57.22053411719822]
ChestX-Reasoner(チェストX-Reasoner)は、臨床報告から直接採掘されるプロセスの監督を活用するために設計された放射線診断MLLMである。
我々の2段階のトレーニングフレームワークは、モデル推論と臨床標準との整合性を高めるために、プロセス報酬によって指導された教師付き微調整と強化学習を組み合わせる。
論文 参考訳(メタデータ) (2025-04-29T16:48:23Z) - A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0]
Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-12-13T12:47:30Z) - LSM-YOLO: A Compact and Effective ROI Detector for Medical Detection [8.812471041082105]
軽量適応抽出(LAE)とマルチパスシャント特徴マッチング(MSFM)を組み合わせた軽量シャントマッチングヨロ(LSM-YOLO)という新しいモデルを提案する。
LSM-YOLOは、膵腫瘍のプライベートデータセットで48.6%AP、BCCD血液細胞検出公開データセットで65.1%AP、Br35h脳腫瘍検出公開データセットで73.0%APを達成した。
論文 参考訳(メタデータ) (2024-08-26T08:16:58Z) - DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.827368628263997]
DALL-Mは、コンテキスト合成データを生成することで、臨床データセットを強化するフレームワークである。
構造化された患者データと、放射線学レポートやドメイン固有のリソースから抽出された文脈的知識を統合する。
大規模言語モデル(LLM)を用いて、既存の臨床特徴に対する文脈合成値と、全く新しい臨床的特徴を生成する。
論文 参考訳(メタデータ) (2024-07-11T07:01:50Z) - End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.360760580820966]
放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文 参考訳(メタデータ) (2023-11-27T14:49:06Z) - LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [46.23891509553877]
大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。
LLM駆動型マルチモーダルAI,すなわちLLMSegを提案する。
提案モデルでは,従来のユニモーダルAIモデルと比較して,性能が著しく向上していることが実証された。
論文 参考訳(メタデータ) (2023-11-03T13:38:42Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。