論文の概要: CLEAR: A Clinically-Grounded Tabular Framework for Radiology Report Evaluation
- arxiv url: http://arxiv.org/abs/2505.16325v1
- Date: Thu, 22 May 2025 07:32:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.11921
- Title: CLEAR: A Clinically-Grounded Tabular Framework for Radiology Report Evaluation
- Title(参考訳): クリアー : 放射線診断のための臨床応用タブラリフレームワーク
- Authors: Yuyang Jiang, Chacha Chen, Shengyuan Wang, Feng Li, Zecong Tang, Benjamin M. Mervak, Lydia Chelala, Christopher M Straus, Reve Chahine, Samuel G. Armato III, Chenhao Tan,
- Abstract要約: 専門ラベルを用いた臨床評価フレームワークと放射線診断報告評価のための属性レベル比較(CLEAR)について紹介する。
CLEARは、報告書が医療状況の有無を正確に特定できるかどうかを調べる。
CLEARの臨床的アライメントを測定するため,MIMIC-CXRから得られた100個の胸部X線所見のデータセットであるCLEAR-Benchを開発した。
- 参考スコア(独自算出の注目度): 19.416198842242856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing metrics often lack the granularity and interpretability to capture nuanced clinical differences between candidate and ground-truth radiology reports, resulting in suboptimal evaluation. We introduce a Clinically-grounded tabular framework with Expert-curated labels and Attribute-level comparison for Radiology report evaluation (CLEAR). CLEAR not only examines whether a report can accurately identify the presence or absence of medical conditions, but also assesses whether it can precisely describe each positively identified condition across five key attributes: first occurrence, change, severity, descriptive location, and recommendation. Compared to prior works, CLEAR's multi-dimensional, attribute-level outputs enable a more comprehensive and clinically interpretable evaluation of report quality. Additionally, to measure the clinical alignment of CLEAR, we collaborate with five board-certified radiologists to develop CLEAR-Bench, a dataset of 100 chest X-ray reports from MIMIC-CXR, annotated across 6 curated attributes and 13 CheXpert conditions. Our experiments show that CLEAR achieves high accuracy in extracting clinical attributes and provides automated metrics that are strongly aligned with clinical judgment.
- Abstract(参考訳): 既存の測定値には, 候補と地中X線診断の微妙な臨床差を捉えるための粒度や解釈性の欠如がしばしば見られ, 準最適評価がもたらされた。
専門ラベルと属性レベルの比較を併用した臨床評価表(CLEAR)について紹介する。
CLEARは、報告書が医学的状態の有無を正確に特定できるかどうかだけでなく、最初の発生、変化、深刻度、記述的位置、推奨の5つの重要な属性にまたがって、正に特定された各条件を正確に記述できるかどうかを評価する。
以前の研究と比較すると、CLEARの多次元の属性レベルの出力は、レポートの品質をより包括的で臨床的に解釈可能な評価を可能にする。
さらに, CLEARの臨床的アライメントを測定するため, CLEAR-Benchを5名の放射線技師と共同で開発し, MIMIC-CXRから得られた100個の胸部X線所見, 6個のキュレートされた属性と13個のCheXpert条件について検討した。
臨床属性の抽出においてCLEARは高い精度を達成し,臨床判断に強く適合する自動指標を提供する。
関連論文リスト
- MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports [49.00805568780791]
MedCaseReasoningはLarge Language Models(LLM)を評価するための最初のオープンアクセスデータセットである。
データセットには14,489の診断的質問・回答ケースが含まれており、それぞれに詳細な推論文がペアリングされている。
我々は,MedCaseReasoning上での最先端の推論LPMを評価し,診断と推論に重大な欠点を見出した。
論文 参考訳(メタデータ) (2025-05-16T22:34:36Z) - IP-CRR: Information Pursuit for Interpretable Classification of Chest Radiology Reports [31.359504909372884]
本稿では,放射線学レポートの分類のための解釈可能なフレームワークを提案する。
キーとなる考え方は、大量のレポートから最も情報性の高いクエリの集合を抽出し、これらのクエリとその対応する回答を使用して診断を予測することである。
提案手法の有効性を示すMIMIC-CXRデータセットの実験を行った。
論文 参考訳(メタデータ) (2025-04-30T21:20:05Z) - GEMA-Score: Granular Explainable Multi-Agent Score for Radiology Report Evaluation [8.071354543390274]
本稿では,粒状説明可能マルチエージェントスコア(GEMA-Score)を提案する。
GEMA-Scoreは大規模言語モデルに基づくマルチエージェントワークフローを通じて客観的定量化と主観評価を行う。
実験により、GEMA-Scoreは、公開データセット上での人間の専門家評価と最も高い相関を達成できることが示された。
論文 参考訳(メタデータ) (2025-03-07T11:42:22Z) - DALL-M: Context-Aware Clinical Data Augmentation with LLMs [13.827368628263997]
DALL-Mは、コンテキスト合成データを生成することで、臨床データセットを強化するフレームワークである。
構造化された患者データと、放射線学レポートやドメイン固有のリソースから抽出された文脈的知識を統合する。
大規模言語モデル(LLM)を用いて、既存の臨床特徴に対する文脈合成値と、全く新しい臨床的特徴を生成する。
論文 参考訳(メタデータ) (2024-07-11T07:01:50Z) - RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - FlexR: Few-shot Classification with Language Embeddings for Structured
Reporting of Chest X-rays [37.15474283789249]
構造化された報告テンプレートにおける文によって定義される臨床所見を予測する手法を提案する。
この手法は、胸部X線と関連する自由テキストラジオグラフィーレポートを用いて、対照的な言語画像モデルを訓練することを含む。
その結果, 訓練用画像レベルのアノテーションが限られている場合でも, 胸部X線における重症度評価の構造化された報告タスクを達成できることが示唆された。
論文 参考訳(メタデータ) (2022-03-29T16:31:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。