論文の概要: RadAnnotate: Large Language Models for Efficient and Reliable Radiology Report Annotation
- arxiv url: http://arxiv.org/abs/2603.16002v1
- Date: Mon, 16 Mar 2026 23:23:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.03792
- Title: RadAnnotate: Large Language Models for Efficient and Reliable Radiology Report Annotation
- Title(参考訳): RadAnnotate: 効率的で信頼性の高いRadiology Report Annotationのための大規模言語モデル
- Authors: Saisha Pradeep Shetty, Roger Eric Goldman, Vladimir Filkov,
- Abstract要約: RadAnnotateは、RadGraphのラベル付けに関する専門家の努力を減らすために、検索強化された合成レポートと信頼に基づく選択的な自動化について研究している。
まず、金本位レポートにエンティティ固有の分類器を訓練し、解剖学や観察のカテゴリにまたがる強度と障害モードを特徴付ける。
第2に、RAG誘導合成報告を生成し、合成専用モデルがゴールドトレーニングモデルの1-2F1ポイント以内に留まっており、特に低リソース環境での不確実な観測に有用であることを示す。
- 参考スコア(独自算出の注目度): 1.5548318368505492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Radiology report annotation is essential for clinical NLP, yet manual labeling is slow and costly. We present RadAnnotate, an LLM-based framework that studies retrieval-augmented synthetic reports and confidence-based selective automation to reduce expert effort for labeling in RadGraph. We study RadGraph-style entity labeling (graph nodes) and leave relation extraction (edges) to future work. First, we train entity-specific classifiers on gold-standard reports and characterize their strengths and failure modes across anatomy and observation categories, with uncertain observations hardest to learn. Second, we generate RAG-guided synthetic reports and show that synthetic-only models remain within 1-2 F1 points of gold-trained models, and that synthetic augmentation is especially helpful for uncertain observations in a low-resource setting, improving F1 from 0.61 to 0.70. Finally, by learning entity-specific confidence thresholds, RadAnnotate can automatically annotate 55-90% of reports at 0.86-0.92 entity match score while routing low-confidence cases for expert review.
- Abstract(参考訳): 放射線診断はNLPに必須であるが,手動ラベリングは遅く,費用もかかる。
我々は、RadGraphにおけるラベル付けの専門的労力を削減するために、検索強化された合成レポートと信頼に基づく選択的自動化を研究するLLMベースのフレームワークRadAnnotateを提案する。
我々はRadGraphスタイルのエンティティラベリング(グラフノード)について検討し、関係抽出(エッジ)を今後の研究に任せる。
まず、金本位レポートにエンティティ固有の分類器を訓練し、解剖学や観察カテゴリーにまたがる強度と障害モードを特徴付ける。
第2に、RAG誘導合成報告を生成し、合成専用モデルがゴールドトレーニングモデルの1-2F1点内に留まり、合成増強が低リソース環境での不確実な観測に特に有用であることを示し、F1を0.61から0.70に改善した。
最後に、RadAnnotateは、エンティティ固有の信頼しきい値を学ぶことで、専門家レビューのために低信頼のケースをルーティングしながら、0.86-0.92エンティティマッチスコアで55-90%のレポートを自動的に注釈付けすることができる。
関連論文リスト
- HARE: an entity and relation centric evaluation framework for histopathology reports [12.209068071559829]
我々は,新しい実体と関係中心のフレームワークであるHARE(Histopathology Automated Report Evaluation)を提案する。
HarEは、重要な病理組織学的実体と参照と生成された報告の関係を整合させることにより、臨床的に関係のある内容の優先順位付けを行う。
GatorTronSはドメイン適応型言語モデルで、HARE-NERとHARE-REを開発した。
論文 参考訳(メタデータ) (2025-09-19T18:12:19Z) - Extracting ORR Catalyst Information for Fuel Cell from Scientific Literature [1.2499537119440245]
我々は、複数の事前学習されたBERT変異を持つDyGIE++を用いて、名前付きエンティティ認識(NER)と関係抽出(RE)アプローチを提案する。
包括的なデータセットは、12の重要なエンティティと2つのエンティティ間の関係タイプを識別することで手動で構築された。
実験により、微調整されたPubMedBERTモデルは82.19%のNER F1スコアを獲得し、MatSciBERTモデルは66.10%のRE F1スコアを達成した。
論文 参考訳(メタデータ) (2025-07-10T07:35:12Z) - Enhancing chest X-ray datasets with privacy-preserving large language models and multi-type annotations: a data-driven approach for improved classification [0.6144680854063935]
胸部X線(CXR)画像解析では、通常、ルールベースのシステムはデータセットリリースのレポートからラベルを抽出するために使用される。
本稿では,局所的に実行可能なLarge Language Model (LLM) を利用して,発見ラベルの抽出と拡張を行う新しいアプローチであるMAPLEZを提案する。
論文 参考訳(メタデータ) (2024-03-06T20:10:41Z) - Automated Labeling of German Chest X-Ray Radiology Reports using Deep
Learning [50.591267188664666]
本稿では,ルールベースのドイツ語CheXpertモデルによってラベル付けされたレポートに基づいて,ディープラーニングに基づくCheXpertラベル予測モデルを提案する。
その結果,3つのタスクすべてにおいて,ルールベースモデルを大幅に上回ったアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-06-09T16:08:35Z) - Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report
Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。
詳しくは、グラフの基本構造は一般知識から事前構築される。
各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文 参考訳(メタデータ) (2023-03-18T03:53:43Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - AutoTriggER: Label-Efficient and Robust Named Entity Recognition with
Auxiliary Trigger Extraction [54.20039200180071]
我々は,エンティティトリガの自動生成と活用によるNER性能向上のための新しいフレームワークを提案する。
筆者らのフレームワークは,ポストホックな説明を活用して合理的な知識を生成し,埋め込み手法を用いてモデルの事前知識を強化する。
AutoTriggERは強力なラベル効率を示し、目に見えないエンティティを一般化し、RoBERTa-CRFベースラインを平均0.5F1ポイント上回る性能を持つ。
論文 参考訳(メタデータ) (2021-09-10T08:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。