Fugu-MT 論文翻訳(概要): RadioRAG: Factual large language models for enhanced diagnostics in radiology using online retrieval augmented generation

論文の概要: RadioRAG: Factual large language models for enhanced diagnostics in radiology using online retrieval augmented generation

arxiv url: http://arxiv.org/abs/2407.15621v2
Date: Wed, 25 Dec 2024 10:49:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-30 21:44:04.784682
Title: RadioRAG: Factual large language models for enhanced diagnostics in radiology using online retrieval augmented generation
Title（参考訳）: RadioRAG:オンライン検索拡張生成を用いた放射線学における診断能力向上のためのFactual Large Language Model
Authors: Soroosh Tayebi Arasteh, Mahshad Lotfinia, Keno Bressem, Robert Siepmann, Lisa Adams, Dyke Ferber, Christiane Kuhl, Jakob Nikolas Kather, Sven Nebelung, Daniel Truhn,
Abstract要約: 大規模言語モデル(LLM)は、しばしば静的トレーニングデータセットに基づいて時代遅れまたは不正確な情報を生成する。 RAG(Radio-to-end framework, 無線RAG)は, 信頼できる無線オンラインソースからデータをリアルタイムに取得するフレームワークである。
参考スコア（独自算出の注目度）: 1.7618750189510493
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models (LLMs) often generate outdated or inaccurate information based on static training datasets. Retrieval augmented generation (RAG) mitigates this by integrating outside data sources. While previous RAG systems used pre-assembled, fixed databases with limited flexibility, we have developed Radiology RAG (RadioRAG), an end-to-end framework that retrieves data from authoritative radiologic online sources in real-time. We evaluate the diagnostic accuracy of various LLMs when answering radiology-specific questions with and without access to additional online information via RAG. Using 80 questions from the RSNA Case Collection across radiologic subspecialties and 24 additional expert-curated questions with reference standard answers, LLMs (GPT-3.5-turbo, GPT-4, Mistral-7B, Mixtral-8x7B, and Llama3 [8B and 70B]) were prompted with and without RadioRAG in a zero-shot inference scenario RadioRAG retrieved context-specific information from www.radiopaedia.org in real-time. Accuracy was investigated. Statistical analyses were performed using bootstrapping. The results were further compared with human performance. RadioRAG improved diagnostic accuracy across most LLMs, with relative accuracy increases ranging up to 54% for different LLMs. It matched or exceeded non-RAG models and the human radiologist in question answering across radiologic subspecialties, particularly in breast imaging and emergency radiology. However, the degree of improvement varied among models; GPT-3.5-turbo and Mixtral-8x7B-instruct-v0.1 saw notable gains, while Mistral-7B-instruct-v0.2 showed no improvement, highlighting variability in RadioRAG's effectiveness. LLMs benefit when provided access to domain-specific data beyond their training data. For radiology, RadioRAG establishes a robust framework that substantially improves diagnostic accuracy and factuality in radiological question answering.
Abstract（参考訳）: 大規模言語モデル(LLM)は、しばしば静的トレーニングデータセットに基づいて時代遅れまたは不正確な情報を生成する。検索拡張生成(RAG)は、外部データソースを統合することでこれを緩和する。従来のRAGシステムでは,事前組立固定データベースを限られた柔軟性で使用していたが,無線RAG(RadioRAG)を開発した。 RAGを介して追加のオンライン情報にアクセスすることなく, 放射線学固有の質問に答える際に, 様々なLSMの診断精度を評価する。 LLMs (GPT-3.5-turbo, GPT-4, Mistral-7B, Mixtral-8x7B, Llama3 [8B, 70B]) はゼロショット推論シナリオで、RadioRAGは、www.radiopaedia.orgから文脈固有の情報をリアルタイムで取得した。正確さが調査された。ブートストラップを用いた統計的解析を行った。結果は、人間のパフォーマンスとさらに比較された。 RadioRAGは診断精度をほとんどのLLMで改善し、相対的精度は異なるLLMで54%まで向上した。非RAGモデルとヒトの放射線技師は、特に乳房画像や緊急放射線学において、放射線学の亜種にまたがって答えた。 GPT-3.5-turboとMixtral-8x7B-instruct-v0.1は顕著な上昇を示し、Mistral-7B-instruct-v0.2は改善を示さなかった。 LLMは、トレーニングデータ以外のドメイン固有のデータへのアクセスを提供する場合のメリットである。放射線学において、RadioRAGは、放射線学的質問応答における診断精度と事実性を大幅に改善する堅牢な枠組みを確立する。

関連論文リスト

A DeepSeek-Powered AI System for Automated Chest Radiograph Interpretation in Clinical Practice [83.11942224668127]
Janus-Pro-CXR (1B) はDeepSeek Janus-Proモデルに基づく胸部X線解釈システムである。本システムは, 自動レポート生成において, 最先端のX線レポート生成モデルより優れる。
論文参考訳（メタデータ） (2025-12-23T13:26:13Z)
Closing the Performance Gap Between AI and Radiologists in Chest X-Ray Reporting [40.40577855417923]
胸部X線レポート生成のための臨床評価型マルチモーダルAIモデルMAIRA-Xを紹介する。タイプや縦方向の変化,配置などの属性を報告する上での精度を評価するために,新しいL&T特化メトリクスフレームワークを開発した。以上の結果から,MAIRA-Xは放射線科医,特に高用量臨床現場で効果的に治療できる可能性が示唆された。
論文参考訳（メタデータ） (2025-11-21T10:53:26Z)
Retrieval-Augmented Generation for Reliable Interpretation of Radio Regulations [49.671779378073886]
無線規制分野における質問応答について検討する。本稿では,通信事業者固有のレトリーバル拡張生成(RAG)パイプラインを提案する。当社のアプローチは,テスト対象モデル全体の生成精度を一貫して向上させる。
論文参考訳（メタデータ） (2025-09-11T17:43:42Z)
Agentic large language models improve retrieval-based radiology question answering [4.340742745938289]
エージェント検索はゼロショットプロンプトよりも平均診断精度が有意に向上した。最大の利益は中型モデルで発生した。臨床的に微調整されたモデルでさえ、有意義な改善が見られた。
論文参考訳（メタデータ） (2025-08-01T16:18:52Z)
TrackRAD2025 challenge dataset: Real-time tumor tracking for MRI-guided radiotherapy [2.45070347370137]
このデータセットは、6つのセンターから585人の患者に2D cine MRIの矢状画像から作成されている。より正確な運動管理と適応的な治療戦略を可能にすることにより、このデータセットは放射線治療の分野を著しく前進させる可能性がある。
論文参考訳（メタデータ） (2025-03-24T20:14:42Z)
LUND-PROBE -- LUND Prostate Radiotherapy Open Benchmarking and Evaluation dataset [0.0]
MRI誘導放射線療法を施行した前立腺癌432例に対する、MRIおよび合成CT(sCT)画像、ターゲットおよびOARsセグメンテーション、線量放射線療法を含む、一般に利用可能な臨床データセットが提示される。また、深層学習(DL)生成セグメンテーション、DLセグメンテーションの不確実性マップ、および4人の放射線腫瘍学者によって手動で調整されたDLセグメンテーションなど、35人の患者による拡張データセットも含んでいる。本論文は, 自動放射線治療計画, セグメンテーション, サーバ間分析, DLモデル不確実性調査の分野における研究を支援することを目的としている。
論文参考訳（メタデータ） (2025-02-06T20:44:42Z)
MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。 Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文参考訳（メタデータ） (2024-10-16T23:03:27Z)
Preference Fine-Tuning for Factuality in Chest X-Ray Interpretation Models Without Human Feedback [10.826651024680169]
放射線技師は医療画像を医療報告に翻訳することで重要な役割を担っている。視覚言語モデル(VLM)を用いた自動アプローチは、アシスタントとして有望であるが、非常に高い精度を必要とする。胸部X線(CXR)レポート生成に着目し,放射線学におけるVLMの自動選好アライメント手法を提案する。
論文参考訳（メタデータ） (2024-10-09T16:07:11Z)
Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。 ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文参考訳（メタデータ） (2024-08-19T15:04:42Z)
MGH Radiology Llama: A Llama 3 70B Model for Radiology [27.575944159578786]
本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。 Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文参考訳（メタデータ） (2024-08-13T01:30:03Z)
RAD-PHI2: Instruction Tuning PHI-2 for Radiology [2.774342358600601]
小言語モデル(SLM)は、一般的なドメイン言語理解、推論、コーディングタスクにおいて顕著なパフォーマンスを示している。本研究では,SLMの一般放射線学知識への応用,特に症状の理解に関連する質問応答について検討する。胸部X線レポートに関連する一般領域タスクと放射線学固有のタスクの両方でPhi-2を微調整することにより、Rad-Phi2を作成する。
論文参考訳（メタデータ） (2024-03-12T17:27:22Z)
Large Model driven Radiology Report Generation with Clinical Quality Reinforcement Learning [16.849933628738277]
放射線学報告生成 (RRG) は, 放射線技師の作業量削減の可能性から注目されている。本稿では,新しいRRG法である textbfLM-RRG について紹介する。 MIMIC-CXRおよびIU-Xrayデータセットを用いた実験により,本手法が技術状況よりも優れていることを示す。
論文参考訳（メタデータ） (2024-03-11T13:47:11Z)
ChatRadio-Valuer: A Chat Large Language Model for Generalizable Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。 ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文参考訳（メタデータ） (2023-10-08T17:23:17Z)
Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。 MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2023-08-29T17:44:28Z)
Radiology-GPT: A Large Language Model for Radiology [74.07944784968372]
本稿では,ラジオロジーのための大規模言語モデルであるRadiology-GPTを紹介する。 StableLM、Dolly、LLaMAといった一般的な言語モデルと比較して、優れたパフォーマンスを示している。放射線診断、研究、通信において大きな汎用性を示す。
論文参考訳（メタデータ） (2023-06-14T17:57:24Z)
An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文参考訳（メタデータ） (2023-04-17T17:13:42Z)
Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。 IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2023-03-16T07:23:55Z)
Radiomics-Guided Global-Local Transformer for Weakly Supervised Pathology Localization in Chest X-Rays [65.88435151891369]
Radiomics-Guided Transformer (RGT)は、テキストトグロバル画像情報と、テキストトグロバル情報とを融合する。 RGTは、画像トランスフォーマーブランチ、放射能トランスフォーマーブランチ、および画像と放射線情報を集約する融合層から構成される。
論文参考訳（メタデータ） (2022-07-10T06:32:56Z)
Automated Radiological Report Generation For Chest X-Rays With Weakly-Supervised End-to-End Deep Learning [17.315387269810426]
我々は12,000以上のCXRスキャンと放射線学的レポートを含むデータベースを構築した。我々は,深層畳み込みニューラルネットワークとアテンション機構を持つリカレントネットワークに基づくモデルを開発した。このモデルは、与えられたスキャンを自動的に認識し、レポートを生成する。
論文参考訳（メタデータ） (2020-06-18T08:12:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。