論文の概要: Act Like a Radiologist: Radiology Report Generation across Anatomical Regions
- arxiv url: http://arxiv.org/abs/2305.16685v2
- Date: Thu, 10 Oct 2024 10:53:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-11 14:28:33.688200
- Title: Act Like a Radiologist: Radiology Report Generation across Anatomical Regions
- Title(参考訳): 放射線科医としての行為 : 解剖学的領域にまたがる放射線学報告
- Authors: Qi Chen, Yutong Xie, Biao Wu, Xiaomin Chen, James Ang, Minh-Son To, Xiaojun Chang, Qi Wu,
- Abstract要約: X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。
X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。
画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
- 参考スコア(独自算出の注目度): 50.13206214694885
- License:
- Abstract: Automating radiology report generation can ease the reporting workload for radiologists. However, existing works focus mainly on the chest area due to the limited availability of public datasets for other regions. Besides, they often rely on naive data-driven approaches, e.g., a basic encoder-decoder framework with captioning loss, which limits their ability to recognise complex patterns across diverse anatomical regions. To address these issues, we propose X-RGen, a radiologist-minded report generation framework across six anatomical regions. In X-RGen, we seek to mimic the behaviour of human radiologists, breaking them down into four principal phases: 1) initial observation, 2) cross-region analysis, 3) medical interpretation, and 4) report formation. Firstly, we adopt an image encoder for feature extraction, akin to a radiologist's preliminary review. Secondly, we enhance the recognition capacity of the image encoder by analysing images and reports across various regions, mimicking how radiologists gain their experience and improve their professional ability from past cases. Thirdly, just as radiologists apply their expertise to interpret radiology images, we introduce radiological knowledge of multiple anatomical regions to further analyse the features from a clinical perspective. Lastly, we generate reports based on the medical-aware features using a typical auto-regressive text decoder. Both natural language generation (NLG) and clinical efficacy metrics show the effectiveness of X-RGen on six X-ray datasets. Our code and checkpoints are available at: https://github.com/YtongXie/X-RGen.
- Abstract(参考訳): 放射線学レポート生成の自動化は、放射線学者の報告作業の負担を軽減することができる。
しかし、既存の研究は、他地域の公開データセットが限られているため、胸部を中心に活動している。
さらに、単純なデータ駆動アプローチ、例えばキャプション損失を伴う基本的なエンコーダ/デコーダフレームワークにも依存することが多いため、さまざまな解剖学的領域にわたる複雑なパターンの認識が制限される。
これらの課題に対処するために,6つの解剖学的領域にまたがるX-RGenを提案する。
X-RGenでは、人間の放射線学者の行動を模倣し、これらを4つの主要な段階に分割する。
1)最初の観察。
2)地域横断分析
3【医学的解釈】
4) 報告書作成。
まず,画像エンコーダを用いて特徴抽出を行う。
次に, 画像エンコーダの認識能力を向上させるために, 各種領域の画像を解析し, 放射線科医が過去の事例からどのように経験を得て, 職業能力を向上させるかを模擬した。
第3に, 放射線医が放射線画像の解釈にその専門知識を応用するのと同じように, 複数の解剖学的領域の放射線学的知識を導入し, その特徴を臨床的観点から分析する。
最後に、典型的な自動回帰テキストデコーダを用いて、医療認識機能に基づいたレポートを生成する。
自然言語生成(NLG)と臨床効果指標の両方が、6つのX線データセットに対するX-RGenの有効性を示している。
私たちのコードとチェックポイントは、https://github.com/YtongXie/X-RGen.comで利用可能です。
関連論文リスト
- Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities [5.629645463085369]
MRIの脳病変のモデルは通常、特定の疾患のために開発され、事前に定義されたMRIモダリティのセットでデータに基づいて訓練される。
それぞれのモデルでは、MRIの異なるデータを使って疾患を分類することはできないし、他の種類の疾患も分類できない。
我々は、フェデレートラーニングフレームワークが、トレーニング中に見られるすべての疾患の分類において非常に有望な、単一のモデルをトレーニングできることを示します。
論文 参考訳(メタデータ) (2024-06-17T15:16:18Z) - Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography [50.08496922659307]
本稿では、単一のモデルであるUniversal Modelが複数の公開データセットに対処し、新しいクラスに適応することを可能にするユニバーサルフレームワークを提案する。
まず,大規模言語モデルからの言語埋め込みを利用した新しい言語駆動パラメータ生成手法を提案する。
第二に、従来の出力層は軽量でクラス固有のヘッドに置き換えられ、ユニバーサルモデルでは25の臓器と6種類の腫瘍を同時に分割することができる。
論文 参考訳(メタデータ) (2024-05-28T16:55:15Z) - One model to use them all: Training a segmentation model with complementary datasets [38.73145509617609]
補足アノテーションを提供する部分注釈付きデータセットを1つのモデルに結合する手法を提案する。
このアプローチは6つのクラスを1つのモデルにうまく組み合わせ、全体のDice Scoreを4.4%増加させました。
胃と大腸の混同を24%減らすことができた。
論文 参考訳(メタデータ) (2024-02-29T16:46:49Z) - Complex Organ Mask Guided Radiology Report Generation [13.96983438709763]
我々は,複合臓器マスクガイド(COMG)レポート生成モデルを提案する。
融合過程において各臓器に対応する疾患の事前知識を活用し,疾患の同定フェーズを増強する。
2つの公開データセットの結果、COMGはSOTAモデルKiUTよりもBLEU@4スコアで11.4%と9.7%改善している。
論文 参考訳(メタデータ) (2023-11-04T05:34:24Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - sJIVE: Supervised Joint and Individual Variation Explained [0.0]
同一対象データに対する複数ビューであるマルチソースデータの解析は, 生物医学研究においてますます一般的になっている。
本研究では,共有構造(共同)とソース固有構造(個別構造)を同時に識別する手法であるsjive(supervised joint and individual variation explained)を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:54:45Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Have you forgotten? A method to assess if machine learning models have
forgotten data [20.9131206112401]
ディープラーニングの時代において、複数のソースからのデータの集約は、データの多様性を保証するための一般的なアプローチである。
本稿では、モデルによってデータが忘れられたかどうかという課題に対処する。
我々は、ターゲットの出力と異なるデータセットで訓練されたモデルの出力を比較する統計的手法を確立する。
論文 参考訳(メタデータ) (2020-04-21T16:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。