論文の概要: FM-OSD: Foundation Model-Enabled One-Shot Detection of Anatomical Landmarks
- arxiv url: http://arxiv.org/abs/2407.05412v1
- Date: Sun, 7 Jul 2024 15:37:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 19:47:49.307667
- Title: FM-OSD: Foundation Model-Enabled One-Shot Detection of Anatomical Landmarks
- Title(参考訳): FM-OSD:基礎モデルによる解剖学的ランドマークのワンショット検出
- Authors: Juzheng Miao, Cheng Chen, Keli Zhang, Jie Chuai, Quanzheng Li, Pheng-Ann Heng,
- Abstract要約: 医用画像のランドマーク検出を高精度に行うための,最初の基礎モデル付きワンショットランドマーク検出(FM-OSD)フレームワークを提案する。
本手法は,単一のテンプレート画像のみを用いることで,最先端のワンショットランドマーク検出法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 44.54301473673582
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One-shot detection of anatomical landmarks is gaining significant attention for its efficiency in using minimal labeled data to produce promising results. However, the success of current methods heavily relies on the employment of extensive unlabeled data to pre-train an effective feature extractor, which limits their applicability in scenarios where a substantial amount of unlabeled data is unavailable. In this paper, we propose the first foundation model-enabled one-shot landmark detection (FM-OSD) framework for accurate landmark detection in medical images by utilizing solely a single template image without any additional unlabeled data. Specifically, we use the frozen image encoder of visual foundation models as the feature extractor, and introduce dual-branch global and local feature decoders to increase the resolution of extracted features in a coarse to fine manner. The introduced feature decoders are efficiently trained with a distance-aware similarity learning loss to incorporate domain knowledge from the single template image. Moreover, a novel bidirectional matching strategy is developed to improve both robustness and accuracy of landmark detection in the case of scattered similarity map obtained by foundation models. We validate our method on two public anatomical landmark detection datasets. By using solely a single template image, our method demonstrates significant superiority over strong state-of-the-art one-shot landmark detection methods.
- Abstract(参考訳): 解剖学的ランドマークのワンショット検出は、最小ラベル付きデータを用いて有望な結果を生み出すことで、その効率に大きな注目を集めている。
しかし、現在の手法の成功は、有効な特徴抽出器を事前訓練するための広範囲な未ラベルデータの利用に大きく依存しており、大量の未ラベルデータが利用できないシナリオにおける適用性を制限している。
本稿では,医用画像の正確なランドマーク検出を行うための基礎モデルを用いた最初の一発ランドマーク検出(FM-OSD)フレームワークを提案する。
具体的には,視覚基盤モデルの凍結画像エンコーダを特徴抽出器として使用し,大域的特徴デコーダと局所的特徴デコーダを導入し,抽出した特徴の分解能を粗い方法で向上させる。
導入された特徴デコーダは、距離対応の類似性学習損失で効率よく訓練され、単一のテンプレート画像からドメイン知識を組み込む。
さらに, 基礎モデルにより得られた類似度マップの分散の場合, ランドマーク検出の堅牢性と精度を向上させるために, 新たな双方向マッチング戦略を開発した。
本手法を2つの公開解剖学的ランドマーク検出データセットで検証する。
本手法は,単一のテンプレート画像のみを用いることで,最先端のワンショットランドマーク検出法よりも優れていることを示す。
関連論文リスト
- Exploiting Diffusion Prior for Out-of-Distribution Detection [11.11093497717038]
堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
拡散モデルの生成能力とCLIPの強力な特徴抽出能力を活用する新しいOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-06-16T23:55:25Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Weakly-supervised deepfake localization in diffusion-generated images [4.548755617115687]
本稿では,Xception ネットワークをバックボーンアーキテクチャとして用いた弱教師付きローカライズ問題を提案する。
本研究では,(局所スコアに基づく)最良動作検出法は,データセットやジェネレータのミスマッチよりも,より緩やかな監視に敏感であることを示す。
論文 参考訳(メタデータ) (2023-11-08T10:27:36Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Combining multi-spectral data with statistical and deep-learning models
for improved exoplanet detection in direct imaging at high contrast [39.90150176899222]
太陽系外惑星の信号は、いくつかの観測と専用の検出アルゴリズムを組み合わせることでのみ識別できる。
我々は,観測結果から直接,ニュアンスの空間的,時間的,スペクトル的特性のモデルを学ぶ。
その後、畳み込みニューラルネットワーク(CNN)が教師ありの方法で訓練され、合成源の残像を検出する。
論文 参考訳(メタデータ) (2023-06-21T13:42:07Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - One-Shot Medical Landmark Detection [11.213814977894314]
本研究では,Cased Comparing to Detect (CC2D) という,ランドマーク検出のための新しいフレームワークを提案する。
CC2Dは,1)自己指導学習(CC2D-SSL)と2)擬似ラベル(CC2D-TPL)の2段階からなる。
CC2Dの有効性は4.0mm以内の81.01%の競争の検出の正確さを達成する頭蓋骨のランドマークの検出の広く利用された公開データセットで評価されます。
論文 参考訳(メタデータ) (2021-03-08T03:16:53Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。