Fugu-MT 論文翻訳(概要): Radiology-Aware Model-Based Evaluation Metric for Report Generation

論文の概要: Radiology-Aware Model-Based Evaluation Metric for Report Generation

arxiv url: http://arxiv.org/abs/2311.16764v1
Date: Tue, 28 Nov 2023 13:08:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-29 18:34:08.210889
Title: Radiology-Aware Model-Based Evaluation Metric for Report Generation
Title（参考訳）: 放射線アウェアモデルに基づくレポート生成のための評価指標
Authors: Amos Calamida, Farhad Nooralahzadeh, Morteza Rohanian, Koji Fujimoto, Mizuho Nishio, Michael Krauthammer
Abstract要約: 提案手法は,放射線学領域に適応したCOMETアーキテクチャを用いて,機械による放射線学レポートの自動評価手法を提案する。我々は、放射線学知識グラフであるRadGraphでトレーニングされた4つの医学的指向のモデルチェックポイントをトレーニングし、公開する。以上の結果から,BERTscore,BLEU,CheXbertのスコアと中程度の相関が得られた。
参考スコア（独自算出の注目度）: 5.168471027680258
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose a new automated evaluation metric for machine-generated radiology reports using the successful COMET architecture adapted for the radiology domain. We train and publish four medically-oriented model checkpoints, including one trained on RadGraph, a radiology knowledge graph. Our results show that our metric correlates moderately to high with established metrics such as BERTscore, BLEU, and CheXbert scores. Furthermore, we demonstrate that one of our checkpoints exhibits a high correlation with human judgment, as assessed using the publicly available annotations of six board-certified radiologists, using a set of 200 reports. We also performed our own analysis gathering annotations with two radiologists on a collection of 100 reports. The results indicate the potential effectiveness of our method as a radiology-specific evaluation metric. The code, data, and model checkpoints to reproduce our findings will be publicly available.
Abstract（参考訳）: 提案手法は,放射線学領域に適応したCOMETアーキテクチャを用いて,機械による放射線学レポートの自動評価手法を提案する。放射線学知識グラフであるRadGraphでトレーニングされた4つの医学的なモデルチェックポイントをトレーニングし、公開する。その結果,我々の測定値は,bertscore,bleu,chexbertスコアなどの確立した測定値と適度に相関していることがわかった。さらに, このチェックポイントの1つは, 200件の報告を用いて, 6人の放射線科医の公開アノテーションを用いて評価し, 人的判断と高い相関性を示すことを示した。我々はまた,100件の報告の収集において,2人の放射線学者とアノテーションを収集する独自の分析を行った。その結果, 放射線学的評価指標としての有効性が示唆された。調査結果を再現するためのコード、データ、モデルチェックポイントが公開される予定だ。

関連論文リスト

RadEval: A framework for radiology text evaluation [18.848190941379222]
RadEvalは、放射線学のテキストを評価するための統一されたオープンソースフレームワークである。古典的なn-gramオーバーラップから臨床概念に基づくスコアまで、さまざまなメトリクスを統合する。 450以上の臨床的に重要なエラーラベルを持つリッチな注釈付き専門家データセットをリリースする。
論文参考訳（メタデータ） (2025-09-22T17:03:48Z)
Uncovering Knowledge Gaps in Radiology Report Generation Models through Knowledge Graphs [18.025481751074214]
我々はReXKGというシステムを導入し,処理されたレポートから構造化された情報を抽出し,放射線学知識グラフを構築する。我々はAIと人手による放射線学レポートの詳細な比較分析を行い、専門家モデルとジェネラリストモデルの両方のパフォーマンスを評価する。
論文参考訳（メタデータ） (2024-08-26T16:28:56Z)
MGH Radiology Llama: A Llama 3 70B Model for Radiology [50.42811030970618]
本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。 Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文参考訳（メタデータ） (2024-08-13T01:30:03Z)
RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。 RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文参考訳（メタデータ） (2024-06-24T17:49:28Z)
LLM-RadJudge: Achieving Radiologist-Level Evaluation for X-Ray Report Generation [37.20505633019773]
生成された放射線学レポートを評価することは、放射線学AIの開発に不可欠である。本研究では,大規模言語モデル (LLM) を用いた新しい評価手法を提案する。
論文参考訳（メタデータ） (2024-04-01T09:02:12Z)
Radiology Report Generation Using Transformers Conditioned with Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文参考訳（メタデータ） (2023-11-18T14:52:26Z)
ChatRadio-Valuer: A Chat Large Language Model for Generalizable Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。 ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文参考訳（メタデータ） (2023-10-08T17:23:17Z)
Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。 MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2023-08-29T17:44:28Z)
Act Like a Radiologist: Radiology Report Generation across Anatomical Regions [50.13206214694885]
X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。 X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
論文参考訳（メタデータ） (2023-05-26T07:12:35Z)
Medical Image Captioning via Generative Pretrained Transformers [57.308920993032274]
我々は、Show-Attend-Tell と GPT-3 という2つの言語モデルを組み合わせて、包括的で記述的な放射線学記録を生成する。提案モデルは、Open-I、MIMIC-CXR、汎用MS-COCOの2つの医療データセットで検証される。
論文参考訳（メタデータ） (2022-09-28T10:27:10Z)
RadGraph: Extracting Clinical Entities and Relations from Radiology Reports [6.419031003699479]
RadGraphは、フルテキストの胸部X線診断レポートにおけるエンティティと関係のデータセットである。我々のデータセットは、胸部X線写真にリンクした際のコンピュータビジョンやマルチモーダル学習と同様に、医療自然言語処理の幅広い研究を促進することができる。
論文参考訳（メタデータ） (2021-06-28T08:24:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。