論文の概要: Writing by Memorizing: Hierarchical Retrieval-based Medical Report
Generation
- arxiv url: http://arxiv.org/abs/2106.06471v1
- Date: Tue, 25 May 2021 07:47:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 22:30:43.784400
- Title: Writing by Memorizing: Hierarchical Retrieval-based Medical Report
Generation
- Title(参考訳): write by memorizing: 階層的検索に基づく医療レポート生成
- Authors: Xingyi Yang, Muchao Ye, Quanzeng You, Fenglong Ma
- Abstract要約: レポートと文レベルのテンプレートの両方を自動的に抽出する新しい階層的検索機構を組み込んだMedWriterを提案する。
MedWriterはまずVisual-Language Retrieval(VLR)モジュールを使用して、与えられた画像の最も関連性の高いレポートを取得する。
文間の論理的一貫性を保証するため、言語言語検索(LLR)モジュールを導入し、関連する文を検索する。
最終的に、言語デコーダは、検索されたレポートと文から画像の特徴と特徴を融合して、意味のある医療レポートを生成する。
- 参考スコア(独自算出の注目度): 26.134055930805523
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical report generation is one of the most challenging tasks in medical
image analysis. Although existing approaches have achieved promising results,
they either require a predefined template database in order to retrieve
sentences or ignore the hierarchical nature of medical report generation. To
address these issues, we propose MedWriter that incorporates a novel
hierarchical retrieval mechanism to automatically extract both report and
sentence-level templates for clinically accurate report generation. MedWriter
first employs the Visual-Language Retrieval~(VLR) module to retrieve the most
relevant reports for the given images. To guarantee the logical coherence
between sentences, the Language-Language Retrieval~(LLR) module is introduced
to retrieve relevant sentences based on the previous generated description. At
last, a language decoder fuses image features and features from retrieved
reports and sentences to generate meaningful medical reports. We verified the
effectiveness of our model by automatic evaluation and human evaluation on two
datasets, i.e., Open-I and MIMIC-CXR.
- Abstract(参考訳): 医療レポート生成は、医療画像分析において最も難しい課題の1つである。
既存のアプローチは有望な結果を得たが、文章を取得するために事前に定義されたテンプレートデータベースを必要とするか、医学レポート生成の階層的性質を無視している。
そこで本研究では,新しい階層的検索機構を組み込んだメドライタを提案し,臨床的に正確なレポート生成のためのレポートレベルテンプレートと文レベルのテンプレートを自動抽出する。
MedWriterはまずVisual-Language Retrieval~(VLR)モジュールを使用して、与えられた画像の最も関連性の高いレポートを取得する。
文間の論理コヒーレンスを保証するために、言語-言語検索〜(llr)モジュールを導入し、前述した記述に基づいて関連文を取得する。
最後に、言語デコーダは、検索されたレポートと文から画像の特徴と特徴を融合して意味のある医療レポートを生成する。
我々は,Open-IとMIMIC-CXRの2つのデータセットに対して,自動評価と人的評価によるモデルの有効性を検証した。
関連論文リスト
- Resource-Efficient Medical Report Generation using Large Language Models [3.2627279988912194]
医療報告生成は胸部X線画像の放射線診断レポートを自動作成する作業である。
本稿では,医療報告生成のタスクに視覚対応大規模言語モデル(LLM)を活用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-21T05:08:18Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - MedCycle: Unpaired Medical Report Generation via Cycle-Consistency [11.190146577567548]
一貫性のあるラベリングスキーマを必要としない革新的なアプローチを導入する。
このアプローチは、画像埋め込みをレポート埋め込みに変換するサイクル一貫性マッピング関数に基づいている。
胸部X線所見の発生は、最先端の結果よりも優れており、言語と臨床の両方の指標の改善が示されている。
論文 参考訳(メタデータ) (2024-03-20T09:40:11Z) - RaDialog: A Large Vision-Language Model for Radiology Report Generation
and Conversational Assistance [53.20640629352422]
会話型AIツールは、所定の医療画像に対して臨床的に正しい放射線学レポートを生成し、議論することができる。
RaDialogは、ラジオロジーレポート生成と対話ダイアログのための、初めて徹底的に評価され、公開された大きな視覚言語モデルである。
本手法は,報告生成における最先端の臨床的正確性を実現し,報告の修正や質問への回答などのインタラクティブなタスクにおいて,印象的な能力を示す。
論文 参考訳(メタデータ) (2023-11-30T16:28:40Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Multimodal Image-Text Matching Improves Retrieval-based Chest X-Ray
Report Generation [3.6664023341224827]
X-REM (Contrastive X-Ray Report Match) は、X-REM (X-REM) という新しい検索方式の放射線学レポート生成モジュールである。
X-REMは、胸部X線画像の類似度を測定するための画像テキストマッチングスコアと、レポート検索のための放射線診断レポートを使用する。
論文 参考訳(メタデータ) (2023-03-29T04:00:47Z) - Modeling Sequential Sentence Relation to Improve Cross-lingual Dense
Retrieval [87.11836738011007]
マスク付き文モデル(MSM)と呼ばれる多言語多言語言語モデルを提案する。
MSMは、文表現を生成する文エンコーダと、文書から文ベクトルのシーケンスに適用される文書エンコーダとから構成される。
モデルをトレーニングするために,サンプル負の階層的コントラスト損失によって文ベクトルをマスクし,予測するマスク付き文予測タスクを提案する。
論文 参考訳(メタデータ) (2023-02-03T09:54:27Z) - An Ensemble Approach for Automatic Structuring of Radiology Reports [6.186392239590685]
本稿では,3つのモデルの予測を集約し,文の自動ラベリングのためのテキスト情報の様々な属性をキャプチャするアンサンブル手法を提案する。
提案手法は97.1%の精度で他の手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-05T18:11:23Z) - Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report
Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。
ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文 参考訳(メタデータ) (2020-06-06T01:00:15Z) - CLARA: Clinical Report Auto-completion [56.206459591367405]
CLARA(CLinicit Al It Report It Auto-Completion)は、医師のアンカーワードと部分的に完成した文に基づいて、文章でレポートを生成するインタラクティブな方法である。
実験では,X線で0.393 CIDEr,0.248 BLEU-4,脳波で0.482 CIDEr,0.491 BLEU-4を得た。
論文 参考訳(メタデータ) (2020-02-26T18:45:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。