論文の概要: Prompt-driven Universal Model for View-Agnostic Echocardiography Analysis
- arxiv url: http://arxiv.org/abs/2404.05916v1
- Date: Tue, 9 Apr 2024 00:30:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 16:18:17.355511
- Title: Prompt-driven Universal Model for View-Agnostic Echocardiography Analysis
- Title(参考訳): 視野非依存型心エコー図解析のためのプロンプト駆動型ユニバーサルモデル
- Authors: Sekeun Kim, Hui Ren, Peng Guo, Abder-Rahman Ali, Patrick Zhang, Kyungsang Kim, Xiang Li, Quanzheng Li,
- Abstract要約: 本稿では,視認性心エコー図解析のためのプロンプト駆動型ユニバーサル手法を提案する。
標準ビュー間のドメインシフトを考慮すると、まずプロンプトマッチングと呼ばれる手法を導入する。
そこで本研究では,事前訓練された医療用言語モデルを用いて,テキスト情報を画素データと整合させて正確なセグメンテーションを行う。
- 参考スコア(独自算出の注目度): 12.402357472481532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Echocardiography segmentation for cardiac analysis is time-consuming and resource-intensive due to the variability in image quality and the necessity to process scans from various standard views. While current automated segmentation methods in echocardiography show promising performance, they are trained on specific scan views to analyze corresponding data. However, this solution has a limitation as the number of required models increases with the number of standard views. To address this, in this paper, we present a prompt-driven universal method for view-agnostic echocardiography analysis. Considering the domain shift between standard views, we first introduce a method called prompt matching, aimed at learning prompts specific to different views by matching prompts and querying input embeddings using a pre-trained vision model. Then, we utilized a pre-trained medical language model to align textual information with pixel data for accurate segmentation. Extensive experiments on three standard views showed that our approach significantly outperforms the state-of-the-art universal methods and achieves comparable or even better performances over the segmentation model trained and tested on same views.
- Abstract(参考訳): 心エコー法による心機能解析は, 画像品質の変動と, 各種標準画像からのスキャン処理の必要性により, 時間的, 資源的負荷が伴う。
心エコー図における現在の自動セグメンテーション法は有望な性能を示すが、特定のスキャンビューに基づいて学習し、対応するデータを分析する。
しかし、この解は標準ビューの数とともに必要モデルの数が増加するにつれて制限される。
そこで本論文では,視線非依存型心エコー図解析のための,プロンプト駆動型ユニバーサル手法を提案する。
まず、標準ビュー間のドメインシフトを考慮し、事前学習された視覚モデルを用いて、プロンプトをマッチングし、入力埋め込みをクエリすることで、異なるビューに固有のプロンプトを学習することを目的とした、プロンプトマッチングと呼ばれる手法を導入する。
そこで本研究では,事前訓練された医療用言語モデルを用いて,テキスト情報を画素データと整合させて,正確なセグメンテーションを行った。
3つの標準ビューに対する大規模な実験により、我々のアプローチは最先端のユニバーサルメソッドよりも大幅に優れており、同じビューでトレーニング、テストされたセグメンテーションモデルよりも同等またはそれ以上のパフォーマンスを実現していることがわかった。
関連論文リスト
- Segment as You Wish -- Free-Form Language-Based Segmentation for Medical Images [30.673958586581904]
フリーフォームなテキストプロンプトを処理する新しい医用画像セグメンテーションモデルであるFLanSを紹介する。
FLanSは、7つの公開データセットから100万以上の医療画像の大規模なデータセットでトレーニングされている。
論文 参考訳(メタデータ) (2024-10-02T16:34:32Z) - Extraction of volumetric indices from echocardiography: which deep
learning solution for clinical use? [6.144041824426555]
提案した3D nnU-Netは,2D法と繰り返しセグメンテーション法よりも優れていることを示す。
実験の結果、十分なトレーニングデータがあれば、3D nnU-Netは日常的な臨床機器の基準を満たす最初の自動化ツールとなる可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-03T09:38:52Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Zero-shot Model Diagnosis [80.36063332820568]
ディープラーニングモデルを評価するための一般的なアプローチは、興味のある属性を持つラベル付きテストセットを構築し、そのパフォーマンスを評価することである。
本稿では,ゼロショットモデル診断(ZOOM)がテストセットやラベル付けを必要とせずに可能であることを論じる。
論文 参考訳(メタデータ) (2023-03-27T17:59:33Z) - Multi-Modal Evaluation Approach for Medical Image Segmentation [4.989480853499916]
本稿では,異なるセグメンテーション手法の有効性を評価するために,新しいマルチモーダル評価(MME)手法を提案する。
本稿では, 検出特性, 境界アライメント, 均一性, 総体積, 相対体積など, 関連性, 解釈可能な新しい特徴を紹介する。
提案するアプローチはオープンソースで,使用することができる。
論文 参考訳(メタデータ) (2023-02-08T15:31:33Z) - Contrastive Learning for View Classification of Echocardiograms [5.60187022176608]
不均衡な心エコーデータセットに対するビュー分類モデルを訓練し、最小ラベル付きデータが利用できるビュー/クラスの性能向上を示す。
また,本モデルと比較すると,F1スコアを最大26%向上させながら,十分にラベル付けされたトレーニング観察を行うことができた。
論文 参考訳(メタデータ) (2021-08-06T13:48:06Z) - Interpretability-Driven Sample Selection Using Self Supervised Learning
For Disease Classification And Segmentation [4.898744396854313]
解釈可能なサリエンシーマップに含まれる情報を活用した深層特徴に基づく新しいサンプル選択手法を提案する。
提案手法は, より少ないサンプルで, アートパフォーマンスの状態を導く情報的サンプルの選択において, 他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-13T10:46:33Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。