Fugu-MT 論文翻訳(概要): Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images

論文の概要: Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images

arxiv url: http://arxiv.org/abs/2302.14042v1
Date: Mon, 27 Feb 2023 18:53:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-28 14:14:56.143716
Title: Knowledge-enhanced Pre-training for Auto-diagnosis of Chest Radiology Images
Title（参考訳）: 胸部x線画像の自動診断のための知識強化事前訓練
Authors: Xiaoman Zhang, Chaoyi Wu, Ya Zhang, Yanfeng Wang, Weidi Xie
Abstract要約: 胸部X線画像における自己診断のための知識強調型視覚言語事前訓練手法を提案する。このアルゴリズムはKnowledge-enhanced Auto diagnosis(KAD)と呼ばれ、まず既存の医療知識グラフに基づいて知識エンコーダを訓練する。 3つの外部X線データセットに対するKADの有効性を実験的に検証した。
参考スコア（独自算出の注目度）: 40.52487429030841
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite of the success of multi-modal foundation models pre-trained on large-scale data in natural language understanding and vision recognition, its counterpart in medical and clinical domains remains preliminary, due to the fine-grained recognition nature of the medical tasks with high demands on domain knowledge. Here, we propose a knowledge-enhanced vision-language pre-training approach for auto-diagnosis on chest X-ray images. The algorithm, named Knowledge-enhanced Auto Diagnosis~(KAD), first trains a knowledge encoder based on an existing medical knowledge graph, i.e., learning neural embeddings of the definitions and relationships between medical concepts and then leverages the pre-trained knowledge encoder to guide the visual representation learning with paired chest X-rays and radiology reports. We experimentally validate KAD's effectiveness on three external X-ray datasets. The zero-shot performance of KAD is not only comparable to that of the fully-supervised models but also, for the first time, superior to the average of three expert radiologists for three (out of five) pathologies with statistical significance. When the few-shot annotation is available, KAD also surpasses all existing approaches in finetuning settings, demonstrating the potential for application in different clinical scenarios.
Abstract（参考訳）: 自然言語の理解と視覚認識における大規模データに基づいて事前訓練されたマルチモーダル基礎モデルの成功にもかかわらず、医学や臨床の分野では、ドメイン知識に高い要求がある医療タスクのきめ細かい認識の性質のため、まだ予備的のままである。本稿では,胸部X線画像の自動診断のための知識強調型視覚言語事前訓練手法を提案する。このアルゴリズムはknowledge-enhanced auto diagnostic~(kad)と呼ばれ、まず既存の医学知識グラフに基づいて知識エンコーダを訓練する。すなわち、医学概念の定義と関係の神経埋め込みを学習する。 3つの外部X線データセットに対するKADの有効性を実験的に検証した。 kadのゼロショット性能は、完全に監督されたモデルに匹敵するだけでなく、統計的に有意な3つの(5つのうちの)病理学において、3人の専門家放射線学者の平均よりも初めて優れている。数ショットのアノテーションが利用できる場合、KADは設定の微調整において既存のすべてのアプローチを越え、異なる臨床シナリオにおけるアプリケーションの可能性を示す。

関連論文リスト

MG-3D: Multi-Grained Knowledge-Enhanced 3D Medical Vision-Language Pre-training [7.968487067774351]
3次元医用画像解析は多くの臨床応用において重要である。 3次元医用画像解析では、大規模視覚言語による事前訓練がまだ検討されていない。大規模データ(47.1K)に基づいて事前学習したMG-3Dを提案する。
論文参考訳（メタデータ） (2024-12-08T09:45:59Z)
Abnormality-Driven Representation Learning for Radiology Imaging [0.8321462983924758]
病変強調型コントラスト学習(LeCL)は,CTスキャンの異なる部位にわたる2次元軸方向スライスにおける異常により引き起こされる視覚的表現を得るための新しい手法である。本研究は, 腫瘍病変位置, 肺疾患検出, 患者ステージングの3つの臨床的課題に対するアプローチを, 最先端の4つの基礎モデルと比較した。
論文参考訳（メタデータ） (2024-11-25T13:53:26Z)
The Era of Foundation Models in Medical Imaging is Approaching : A Scoping Review of the Clinical Value of Large-Scale Generative AI Applications in Radiology [0.0]
放射線技師の不足に起因する社会問題は激化しており、人工知能は潜在的な解決策として強調されている。最近出現する大規模生成AIは、大規模言語モデル(LLM)からマルチモーダルモデルへと拡張されている。このスコーピングレビューは、大規模生成型AIアプリケーションの臨床的価値に関する既存の文献を体系的に整理する。
論文参考訳（メタデータ） (2024-09-03T00:48:50Z)
Visual Prompt Engineering for Vision Language Models in Radiology [0.17183214167143138]
Contrastive Language-Image Pretraining (CLIP)は,マルチモーダルな大規模事前訓練によるゼロショット分類を可能にすることで,有望なソリューションを提供する。 CLIPは、グローバルな画像コンテンツを効果的にキャプチャするが、ラジオロジーは、解釈可能性と診断精度の両方を高めるために、特定の病理領域により局所的な焦点をあてる必要がある。視覚的手がかりをゼロショット分類に組み込む可能性を探り、矢印、バウンディングボックス、円などの視覚的マーカーを直接放射線画像に埋め込んでモデル注意を誘導する。
論文参考訳（メタデータ） (2024-08-28T13:53:27Z)
D-Rax: Domain-specific Radiologic assistant leveraging multi-modal data and eXpert model predictions [8.50767187405446]
ドメイン固有の対話型無線支援ツールD-Raxを提案する。我々は胸部X線(CXR)画像の会話解析を強化し,放射線学的報告を支援する。オープン・エンド・会話とクローズド・会話の双方において,反応の統計的に有意な改善が認められた。
論文参考訳（メタデータ） (2024-07-02T18:43:10Z)
DeViDe: Faceted medical knowledge for improved medical vision-language pre-training [1.6567372257085946]
胸部X線に対する視覚言語による事前訓練は、主にペアのX線写真とラジオグラフィーレポートを活用することで大きな進歩を遂げた。オープンウェブからの無線画像記述を利用するトランスフォーマーベースのDeViDeを提案する。 DeViDeは知識強化された視覚言語アライメントの3つの重要な特徴を取り入れている。ゼロショット設定では、DeViDeは外部データセットの完全な教師付きモデルと互換性があり、3つの大規模データセットの最先端結果を達成する。
論文参考訳（メタデータ） (2024-04-04T17:40:06Z)
ChatRadio-Valuer: A Chat Large Language Model for Generalizable Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。 ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文参考訳（メタデータ） (2023-10-08T17:23:17Z)
Act Like a Radiologist: Radiology Report Generation across Anatomical Regions [50.13206214694885]
X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。 X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
論文参考訳（メタデータ） (2023-05-26T07:12:35Z)
MedKLIP: Medical Knowledge Enhanced Language-Image Pre-Training in Radiology [40.52487429030841]
医用医用視覚言語事前訓練を専門知識と組み合わせて行うことを検討する。まず, 生の報告を直接処理する既存の作業とは異なり, 医療関連情報を抽出するために, 新規な三重項抽出モジュールを採用する。第2に,医療分野における豊富な知識を活用するために,知識ベースを問合せすることで,エンティティ翻訳を伴う新しい三重項符号化モジュールを提案する。第3に、トランスフォーマーを用いた融合モデルを用いて、画像パッチレベルでの実体記述と視覚信号との空間的整合を図り、診断を可能にすることを提案する。
論文参考訳（メタデータ） (2023-01-05T18:55:09Z)
Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文参考訳（メタデータ） (2022-12-14T06:04:18Z)
Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation [55.00308939833555]
PPKEDには、Posterior Knowledge Explorer (PoKE), Prior Knowledge Explorer (PrKE), Multi-domain Knowledge Distiller (MKD)の3つのモジュールが含まれている。 PoKEは後部知識を探求し、視覚データのバイアスを軽減するために明確な異常な視覚領域を提供する。 PrKEは、以前の医学知識グラフ(医学知識)と以前の放射線学レポート(作業経験)から以前の知識を探り、テキストデータのバイアスを軽減する。
論文参考訳（メタデータ） (2021-06-13T11:10:02Z)
Variational Knowledge Distillation for Disease Classification in Chest X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文参考訳（メタデータ） (2021-03-19T14:13:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。