Fugu-MT 論文翻訳(概要): Benchmarking Pretrained Vision Embeddings for Near- and Duplicate Detection in Medical Images

論文の概要: Benchmarking Pretrained Vision Embeddings for Near- and Duplicate Detection in Medical Images

arxiv url: http://arxiv.org/abs/2312.07273v2
Date: Thu, 13 Jun 2024 11:59:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-15 00:06:54.671562
Title: Benchmarking Pretrained Vision Embeddings for Near- and Duplicate Detection in Medical Images
Title（参考訳）: 医用画像における近距離・重複検出のための事前学習型視覚埋め込みのベンチマーク
Authors: Tuan Truong, Farnaz Khun Jush, Matthias Lenga,
Abstract要約: 本稿では,2次元コンピュータビジョンの埋め込みを利用した近距離・重複3次元医用画像の同定手法を提案する。公開されているメディカルデスロンデータセットに基づいて,実験的なベンチマークを生成する。
参考スコア（独自算出の注目度）: 0.6827423171182154
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Near- and duplicate image detection is a critical concern in the field of medical imaging. Medical datasets often contain similar or duplicate images from various sources, which can lead to significant performance issues and evaluation biases, especially in machine learning tasks due to data leakage between training and testing subsets. In this paper, we present an approach for identifying near- and duplicate 3D medical images leveraging publicly available 2D computer vision embeddings. We assessed our approach by comparing embeddings extracted from two state-of-the-art self-supervised pretrained models and two different vector index structures for similarity retrieval. We generate an experimental benchmark based on the publicly available Medical Segmentation Decathlon dataset. The proposed method yields promising results for near- and duplicate image detection achieving a mean sensitivity and specificity of 0.9645 and 0.8559, respectively.
Abstract（参考訳）: 近距離・重複画像検出は、医用画像の分野で重要な関心事である。医療データセットには、さまざまなソースからの類似または重複したイメージが含まれていることが多く、特にトレーニングとテストサブセット間のデータ漏洩による機械学習タスクにおいて、パフォーマンス上の問題や評価バイアスを引き起こす可能性がある。本稿では,公用2次元コンピュータビジョン埋め込みを利用した近距離・重複3次元医用画像の同定手法を提案する。類似性検索のための2種類の自己教師付き事前学習モデルと2つの異なるベクトルインデックス構造から抽出した埋め込みを比較検討した。一般に公開されているメディカルセグメンテーション・デカトロンデータセットに基づいて,実験的なベンチマークを生成する。提案手法は,それぞれ0.9645と0.8559の平均感度と特異性を達成し,近接画像検出と重複画像検出に有望な結果を与える。

関連論文リスト

Dual Distillation for Few-Shot Anomaly Detection [41.127862518102425]
異常検出はコンピュータビジョンにおいて重要な課題であり、医用画像に深く影響している。 D$2$4FADは,数発の異常検出のための新しい二重蒸留フレームワークである。本手法は,少数の基準画像のみを用いて,未確認タスクにおける異常を同定する。
論文参考訳（メタデータ） (2026-03-02T10:38:19Z)
MedROV: Towards Real-Time Open-Vocabulary Detection Across Diverse Medical Imaging Modalities [89.81463562506637]
医用画像のための最初のリアルタイムオープン語彙検出モデルであるMedROVを紹介する。対照的な学習とクロスモーダル表現を活用することで、MedROVは既知の構造と新しい構造の両方を効果的に検出する。
論文参考訳（メタデータ） (2025-11-25T18:59:53Z)
RadIR: A Scalable Framework for Multi-Grained Medical Image Retrieval via Radiology Report Mining [64.66825253356869]
本稿では,複数の粒度で画像の類似度を決定するために,高密度ラジオロジーレポートを利用した新しい手法を提案する。我々は、胸部X線用MIMIC-IRとCTスキャン用CTRATE-IRの2つの総合的な医用画像検索データセットを構築した。 RadIR-CXR と Model-ChestCT という2つの検索システムを開発し,従来の画像画像検索と画像レポート検索に優れた性能を示す。
論文参考訳（メタデータ） (2025-03-06T17:43:03Z)
Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets [13.737058479403311]
Fr'echet Radiomic Distance (Fr'echet Radiomic Distance) という医療画像に適した新しい知覚基準を導入する。 FRDは、様々な医療画像の分野で、他の画像分布指標よりも優れていることを示す。 FRDは、低いサンプルサイズでの安定性や計算効率などの付加的な利点を提供する。
論文参考訳（メタデータ） (2024-12-02T13:49:14Z)
Discrepancy-based Diffusion Models for Lesion Detection in Brain MRI [1.8420387715849447]
拡散確率モデル(DPM)はコンピュータビジョンタスクにおいて大きな効果を示した。彼らの顕著なパフォーマンスはラベル付きデータセットに大きく依存しており、医療画像への適用を制限する。本稿では,異なる特徴を取り入れた新しい枠組みを提案する。
論文参考訳（メタデータ） (2024-05-08T11:26:49Z)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-03-19T09:28:19Z)
LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。 55の公開データセットから約13万の医療画像を収集しました。 LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文参考訳（メタデータ） (2023-06-20T22:21:34Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Multimorbidity Content-Based Medical Image Retrieval Using Proxies [37.47987844057842]
本稿では、分類とコンテンツに基づく画像検索の両方に使用できる新しい多ラベルメトリック学習法を提案する。本モデルは,疾患の存在を予測し,これらの予測の証拠を提供することによって診断を支援することができる。分類とコンテンツに基づく画像検索へのアプローチの有効性を2つのマルチモービディティー・ラジオロジー・データセットで実証した。
論文参考訳（メタデータ） (2022-11-22T11:23:53Z)
Margin-Aware Intra-Class Novelty Identification for Medical Images [2.647674705784439]
ノベルティ検出のためのハイブリッドモデル-変換に基づく埋め込み学習(TEND)を提案する。事前訓練されたオートエンコーダを画像特徴抽出器として、TENDは変換されたオートエンコーダから分布内データの特徴埋め込みを偽のアウト・オブ・ディストリビューション入力として識別する。
論文参考訳（メタデータ） (2021-07-31T00:10:26Z)
Malignancy Prediction and Lesion Identification from Clinical Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文参考訳（メタデータ） (2021-04-02T20:52:05Z)
Contrastive Learning of Medical Visual Representations from Paired Images and Text [38.91117443316013]
本研究では,自然発生した記述的ペアリングテキストを活用することで,医用視覚表現を学習するための教師なし戦略であるConVIRTを提案する。この2つのモダリティ間の双方向のコントラスト的目的を通じて、ペア化されたテキストデータを用いて医療画像エンコーダを事前訓練する手法は、ドメインに依存しないため、追加の専門家による入力は不要である。
論文参考訳（メタデータ） (2020-10-02T02:10:18Z)
Improved Slice-wise Tumour Detection in Brain MRIs by Computing Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文参考訳（メタデータ） (2020-07-24T14:02:09Z)
A Bag of Visual Words Model for Medical Image Retrieval [0.9137554315375919]
Bag of Visual Words (BoVW) は、ベクトル空間における固有画像の特徴を効果的に表現する技術である。本稿では、コンテンツに基づく医用画像検索のためのBoVWモデルに基づくMedIRアプローチを提案する。
論文参考訳（メタデータ） (2020-07-18T16:21:30Z)
Semi-supervised Medical Image Classification with Relation-driven Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文参考訳（メタデータ） (2020-05-15T06:57:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。