論文の概要: EAFP-Med: An Efficient Adaptive Feature Processing Module Based on
Prompts for Medical Image Detection
- arxiv url: http://arxiv.org/abs/2311.15540v1
- Date: Mon, 27 Nov 2023 05:10:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 17:02:05.098891
- Title: EAFP-Med: An Efficient Adaptive Feature Processing Module Based on
Prompts for Medical Image Detection
- Title(参考訳): EAFP-Med: 医用画像検出用プロンプトに基づく効率的な適応型特徴処理モジュール
- Authors: Xiang Li, Long Lan, Husam Lahza, Shaowu Yang, Shuihua Wang, Wenjing
Yang, Hengzhu Liu, Yudong Zhang
- Abstract要約: 領域間適応型医用画像検出は、様々な医用画像技術における病変表現の違いにより困難である。
医用画像検出のためのプロンプトに基づく効率的な適応的特徴処理モジュールであるEAFP-Medを提案する。
EAFP-Medは、プロンプトに基づいて様々な医用画像から病変の特徴を効率的に抽出し、モデルの性能を高めることができる。
- 参考スコア(独自算出の注目度): 27.783012550610387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the face of rapid advances in medical imaging, cross-domain adaptive
medical image detection is challenging due to the differences in lesion
representations across various medical imaging technologies. To address this
issue, we draw inspiration from large language models to propose EAFP-Med, an
efficient adaptive feature processing module based on prompts for medical image
detection. EAFP-Med can efficiently extract lesion features of different scales
from a diverse range of medical images based on prompts while being flexible
and not limited by specific imaging techniques. Furthermore, it serves as a
feature preprocessing module that can be connected to any model front-end to
enhance the lesion features in input images. Moreover, we propose a novel
adaptive disease detection model named EAFP-Med ST, which utilizes the Swin
Transformer V2 - Tiny (SwinV2-T) as its backbone and connects it to EAFP-Med.
We have compared our method to nine state-of-the-art methods. Experimental
results demonstrate that EAFP-Med ST achieves the best performance on all three
datasets (chest X-ray images, cranial magnetic resonance imaging images, and
skin images). EAFP-Med can efficiently extract lesion features from various
medical images based on prompts, enhancing the model's performance. This holds
significant potential for improving medical image analysis and diagnosis.
- Abstract(参考訳): 医用画像の急速な進歩に対して,様々な医用画像技術における病変表現の違いから,クロスドメイン適応医用画像検出が課題となっている。
この問題に対処するため,我々は大規模言語モデルからインスピレーションを得て,医療画像検出のためのプロンプトに基づく効率的な適応的特徴処理モジュールeafp-medを提案する。
EAFP-Medは、フレキシブルであり、特定のイメージング技術では制限されない、様々な種類の医療画像から、様々なスケールの病変の特徴を効率的に抽出することができる。
さらに、入力画像の病変機能を強化するために、任意のモデルフロントエンドに接続できる機能前処理モジュールとして機能する。
さらに,Swin Transformer V2-Tiny (SwinV2-T) をバックボーンとし,EAFP-Medに接続する適応型疾患検出モデル EAFP-Med ST を提案する。
我々はこの手法を9つの最先端手法と比較した。
実験の結果,EAFP-Med STは3つのデータセット(ケストX線画像,頭蓋磁気共鳴画像,皮膚画像)で最高の性能を示した。
EAFP-Medは、プロンプトに基づいて様々な医用画像から病変の特徴を効率的に抽出し、モデルの性能を高めることができる。
これは、医用画像解析と診断を改善する大きな可能性を秘めている。
関連論文リスト
- Simultaneous Tri-Modal Medical Image Fusion and Super-Resolution using Conditional Diffusion Model [2.507050016527729]
トリモーダル医療画像融合は、病気の形状、位置、生物学的活動をより包括的に見ることができる。
画像装置の限界や患者の安全への配慮により、医療画像の品質は制限されることが多い。
画像の解像度を向上し、マルチモーダル情報を統合できる技術が緊急に必要である。
論文 参考訳(メタデータ) (2024-04-26T12:13:41Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - DDPM based X-ray Image Synthesizer [0.0]
本稿では, 拡散確率モデル(DDPM)とUNetアーキテクチャを組み合わせたX線画像合成手法を提案する。
本手法では,Kaggleから得られた3000以上の肺炎X線画像を用いて訓練を行った。
その結果, 平均二乗誤差(MSE)が低い実写画像の生成に成功し, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-01-03T04:35:58Z) - FeaInfNet: Diagnosis in Medical Image with Feature-Driven Inference and
Visual Explanations [4.022446255159328]
解釈可能なディープラーニングモデルは、画像認識の分野で広く注目を集めている。
提案されている多くの解釈可能性モデルは、医用画像診断の精度と解釈性に問題がある。
これらの問題を解決するために,機能駆動型推論ネットワーク(FeaInfNet)を提案する。
論文 参考訳(メタデータ) (2023-12-04T13:09:00Z) - Unified Medical Image Pre-training in Language-Guided Common Semantic Space [39.61770813855078]
我々はUnified Medical Image Pre-Trainingフレームワーク(UniMedI)を提案する。
UniMedIは、診断レポートを一般的な意味空間として使用し、医療画像の多様なモダリティの統一表現を作成する。
10種類のデータセットにまたがる2次元画像と3次元画像の性能評価を行った。
論文 参考訳(メタデータ) (2023-11-24T22:01:12Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Customizing General-Purpose Foundation Models for Medical Report
Generation [64.31265734687182]
ラベル付き医用画像-レポートペアの不足は、ディープニューラルネットワークや大規模ニューラルネットワークの開発において大きな課題となっている。
本稿では,コンピュータビジョンと自然言語処理の基盤モデル (FM) として,市販の汎用大規模事前学習モデルのカスタマイズを提案する。
論文 参考訳(メタデータ) (2023-06-09T03:02:36Z) - A Transformer-based representation-learning model with unified
processing of multimodal input for clinical diagnostics [63.106382317917344]
本稿では,マルチモーダル入力を統一的に処理する臨床診断支援として,トランスフォーマーを用いた表現学習モデルについて報告する。
統一モデルは, 肺疾患の同定において, 画像のみのモデル, 非統一型マルチモーダル診断モデルより優れていた。
論文 参考訳(メタデータ) (2023-06-01T16:23:47Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Cross-Modal Information Maximization for Medical Imaging: CMIM [62.28852442561818]
病院では、同じ情報を異なるモダリティの下で利用できるようにする特定の情報システムにデータがサイロ化される。
これは、テスト時に常に利用できないかもしれない同じ情報の複数のビューを列車で取得し、使用するためのユニークな機会を提供する。
テスト時にモダリティの低下に耐性を持つマルチモーダル入力の優れた表現を学習することで、利用可能なデータを最大限活用する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T20:05:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。