論文の概要: Generalized Medical Phrase Grounding
- arxiv url: http://arxiv.org/abs/2512.01085v1
- Date: Sun, 30 Nov 2025 21:09:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.574579
- Title: Generalized Medical Phrase Grounding
- Title(参考訳): 一般医療用薬の接地
- Authors: Wenjun Zhang, Shekhar S. Chandra, Aaron Nicolson,
- Abstract要約: 医用フレーズグラウンドディング(MPG)は、画像領域に放射線所見のテキスト記述をマッピングする。
既存のシステムは、主に参照式理解(REC)パラダイムに従っており、フレーズごとに正確に1つのバウンディングボックスを返す。
各文を0, 1, 複数の得点領域にマッピングする一般医療句接頭辞 (GMPG) として, タスクを再構築する。
- 参考スコア(独自算出の注目度): 8.988088451057822
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical phrase grounding (MPG) maps textual descriptions of radiological findings to corresponding image regions. These grounded reports are easier to interpret, especially for non-experts. Existing MPG systems mostly follow the referring expression comprehension (REC) paradigm and return exactly one bounding box per phrase. Real reports often violate this assumption. They contain multi-region findings, non-diagnostic text, and non-groundable phrases, such as negations or descriptions of normal anatomy. Motivated by this, we reformulate the task as generalised medical phrase grounding (GMPG), where each sentence is mapped to zero, one, or multiple scored regions. To realise this formulation, we introduce the first GMPG model: MedGrounder. We adopted a two-stage training regime: pre-training on report sentence--anatomy box alignment datasets and fine-tuning on report sentence--human annotated box datasets. Experiments on PadChest-GR and MS-CXR show that MedGrounder achieves strong zero-shot transfer and outperforms REC-style and grounded report generation baselines on multi-region and non-groundable phrases, while using far fewer human box annotations. Finally, we show that MedGrounder can be composed with existing report generators to produce grounded reports without retraining the generator.
- Abstract(参考訳): 医用フレーズグラウンドディング(MPG)は、画像領域に放射線所見のテキスト記述をマッピングする。
これらの根拠のあるレポートは解釈しやすく、特に専門家でない人には便利である。
既存のMPGシステムは、主に参照式理解(REC)パラダイムに従っており、フレーズごとに正確に1つのバウンディングボックスを返す。
実際の報告はこの前提に反することが多い。
それらは、複数の領域の発見、非診断的テキスト、そして、否定や正常な解剖学の記述のような、地下にないフレーズを含んでいる。
そこで我々は,各文を0, 1, 複数の評価領域にマッピングする一般医学用語接頭辞 (GMPG) としてタスクを再構築した。
この定式化を実現するため,最初のGMPGモデルであるMedGrounderを紹介した。
我々は,報告文の事前学習-解剖学的ボックスアライメントデータセットと報告文の微調整-人文アノテートボックスデータセット-の2段階のトレーニング制度を採用した。
PadChest-GR と MS-CXR の実験により、MedGrounder は強力なゼロショット転送を実現し、マルチリージョンや非グラウンドブルなフレーズをベースとしたRECスタイルおよびグラウンドドレポート生成ベースラインを上回り、はるかに少ないヒューマンボックスアノテーションを使用する。
最後に、MedGrounderは既存のレポートジェネレータで構成して、ジェネレータを再トレーニングすることなく、グラウンドドレポートを生成することができることを示す。
関連論文リスト
- Large Language Model with Region-guided Referring and Grounding for CT Report Generation [4.804660464589285]
既存の方法は主にボリューム全体のグローバルな特徴についてのみ考慮する。
我々は,CTレポート生成のための第1の領域誘導参照およびグラウンドディングフレームワークであるReg2RGを提案する。
論文 参考訳(メタデータ) (2024-11-23T12:25:06Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Replace and Report: NLP Assisted Radiology Report Generation [31.309987297324845]
無線画像から放射線学レポートを生成するためのテンプレートベースの手法を提案する。
胸部X線検査では, 異常所見の少ない文章を作成し, 正常な報告テンプレートに置き換えることにより, 胸部X線所見を初めて生成する試みである。
論文 参考訳(メタデータ) (2023-06-19T10:04:42Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Writing by Memorizing: Hierarchical Retrieval-based Medical Report
Generation [26.134055930805523]
レポートと文レベルのテンプレートの両方を自動的に抽出する新しい階層的検索機構を組み込んだMedWriterを提案する。
MedWriterはまずVisual-Language Retrieval(VLR)モジュールを使用して、与えられた画像の最も関連性の高いレポートを取得する。
文間の論理的一貫性を保証するため、言語言語検索(LLR)モジュールを導入し、関連する文を検索する。
最終的に、言語デコーダは、検索されたレポートと文から画像の特徴と特徴を融合して、意味のある医療レポートを生成する。
論文 参考訳(メタデータ) (2021-05-25T07:47:23Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z) - Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report
Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。
ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文 参考訳(メタデータ) (2020-06-06T01:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。