論文の概要: Lunguage: A Benchmark for Structured and Sequential Chest X-ray Interpretation
- arxiv url: http://arxiv.org/abs/2505.21190v1
- Date: Tue, 27 May 2025 13:40:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.681459
- Title: Lunguage: A Benchmark for Structured and Sequential Chest X-ray Interpretation
- Title(参考訳): Lunguage: 構造的およびシークエンシャルな胸部X線解析のためのベンチマーク
- Authors: Jong Hak Moon, Geon Choi, Paloma Rabaey, Min Gwan Kim, Hyuk Gi Hong, Jung-Oh Lee, Hangyul Yoon, Eun Woo Doe, Jiyoun Kim, Harshita Sharma, Daniel C. Castro, Javier Alvarez-Valle, Edward Choi,
- Abstract要約: 本稿では,構造化放射線学レポート生成のためのベンチマークデータセットLUNGUAGEを紹介する。
注釈付き胸部X線レポートは1,473件あり、それぞれ専門家がレビューし、そのうち80件は経時的アノテーションを含んでいる。
このベンチマークを用いて、生成したレポートをきめ細かなスキーマ整合構造表現に変換する2段階のフレームワークを開発する。
また、時間的一貫性をモデル化しながら、実体、関係、属性レベルの構造化出力を比較する解釈可能な計量であるLUNGUAGESCOREを提案する。
- 参考スコア(独自算出の注目度): 10.440241401950745
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Radiology reports convey detailed clinical observations and capture diagnostic reasoning that evolves over time. However, existing evaluation methods are limited to single-report settings and rely on coarse metrics that fail to capture fine-grained clinical semantics and temporal dependencies. We introduce LUNGUAGE,a benchmark dataset for structured radiology report generation that supports both single-report evaluation and longitudinal patient-level assessment across multiple studies. It contains 1,473 annotated chest X-ray reports, each reviewed by experts, and 80 of them contain longitudinal annotations to capture disease progression and inter-study intervals, also reviewed by experts. Using this benchmark, we develop a two-stage framework that transforms generated reports into fine-grained, schema-aligned structured representations, enabling longitudinal interpretation. We also propose LUNGUAGESCORE, an interpretable metric that compares structured outputs at the entity, relation, and attribute level while modeling temporal consistency across patient timelines. These contributions establish the first benchmark dataset, structuring framework, and evaluation metric for sequential radiology reporting, with empirical results demonstrating that LUNGUAGESCORE effectively supports structured report evaluation. The code is available at: https://github.com/SuperSupermoon/Lunguage
- Abstract(参考訳): 放射線医学の報告では、詳細な臨床観察と、時間とともに進化する診断的推論が報告されている。
しかし、既存の評価手法は単一レポートの設定に限られており、詳細な臨床的意味や時間的依存を捉えるのに失敗する粗い指標に依存している。
LUNGUAGEは構造化放射線学レポート生成のためのベンチマークデータセットであり,複数研究にわたる単一報告評価と縦断的患者レベル評価の両方をサポートする。
注釈付き胸部X線レポートは1,473件あり、それぞれ専門家がレビューし、80件には病気の進行や研究期間の経過を捉えるための経時的アノテーションが含まれており、専門家もレビューしている。
このベンチマークを用いて、生成したレポートをきめ細かなスキーマ整列構造表現に変換する2段階のフレームワークを開発し、縦方向の解釈を可能にする。
また,患者タイムライン間の時間的一貫性をモデル化しながら,実体,関係,属性レベルの構造的出力を比較する解釈可能な指標LUNGUAGESCOREを提案する。
これらのコントリビューションは、LUNGUAGESCOREが構造化されたレポート評価を効果的にサポートすることを示す実証的な結果とともに、シーケンシャルな放射線学レポートのための最初のベンチマークデータセット、構造化フレームワーク、評価指標を確立する。
コードは、https://github.com/SuperSupermoon/Lunguage.comで入手できる。
関連論文リスト
- HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - Controllable Chest X-Ray Report Generation from Longitudinal
Representations [13.151444796296868]
レポートをスピードアップする1つの戦略は、自動レポートシステムを統合することである。
自動放射線診断への従来のアプローチは、入力として事前の研究を提供していないのが一般的である。
筆者らは,(1) 縦断学習 -- マルチモーダルレポート生成モデルに提供可能な関節長手表現に,現在のスキャン情報と先行スキャン情報を整合し,活用する手法を提案する。(2) 文解剖学的ドロップアウト -- レポート生成モデルを用いて,入力として与えられた解剖学的領域のサブセットに対応する元のレポートからのみ文を予測する訓練戦略。
論文 参考訳(メタデータ) (2023-10-09T17:22:58Z) - Rad-ReStruct: A Novel VQA Benchmark and Method for Structured Radiology
Reporting [45.76458992133422]
Rad-ReStructは、X線画像の構造化レポートという形で、微細で階層的に順序付けられたアノテーションを提供する新しいベンチマークデータセットである。
本稿では,予め質問された質問や回答の形式で事前の文脈を考慮し,構造化された放射線学レポートを収集する手法であるhi-VQAを提案する。
実験の結果, 医用VQAベンチマークVQARadでは, ドメイン固有の視覚言語事前訓練を伴わない手法で, 最先端のVQAと競合する性能が得られた。
論文 参考訳(メタデータ) (2023-07-11T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。