論文の概要: Pretext Matters: An Empirical Study of SSL Methods in Medical Imaging
- arxiv url: http://arxiv.org/abs/2603.22649v1
- Date: Mon, 23 Mar 2026 23:53:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.223788
- Title: Pretext Matters: An Empirical Study of SSL Methods in Medical Imaging
- Title(参考訳): 前提事項:医療画像におけるSSL法に関する実証的研究
- Authors: Vedrana Ivezić, Mara Pleasure, Ashwath Radhachandran, Saarang Panchavati, Shreeram Athreya, Vivek Sant, Benjamin Emert, Gregory Fishbein, Corey Arnold, William Speier,
- Abstract要約: 自己教師付き学習(SSL)は、ラベルのないデータから堅牢な表現を学習する素晴らしい能力を示している。
SSL戦略の最適選択は、特殊なドメインにおいて、非常に異なるパフォーマンス結果をもたらす可能性がある。
本研究では,SSL法の選択が医学画像における学習表現にどのように影響するかを実証的に検討する。
- 参考スコア(独自算出の注目度): 3.7670460987350016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Though self-supervised learning (SSL) has demonstrated incredible ability to learn robust representations from unlabeled data, the choice of optimal SSL strategy can lead to vastly different performance outcomes in specialized domains. Joint embedding architectures (JEAs) and joint embedding predictive architectures (JEPAs) have shown robustness to noise and strong semantic feature learning compared to pixel reconstruction-based SSL methods, leading to widespread adoption in medical imaging. However, no prior work has systematically investigated which SSL objective is better aligned with the spatial organization of clinically relevant signal. In this work, we empirically investigate how the choice of SSL method impacts the learned representations in medical imaging. We select two representative imaging modalities characterized by unique noise profiles: ultrasound and histopathology. When informative signal is spatially localized, as in histopathology, JEAs are more effective due to their view-invariance objective. In contrast, when diagnostically relevant information is globally structured, such as the macroscopic anatomy present in liver ultrasounds, JEPAs are optimal. These differences are especially evident in the clinical relevance of the learned features, as independently validated by board-certified radiologists and pathologists. Together, our results provide a framework for matching SSL objectives to the structural and noise properties of medical imaging modalities.
- Abstract(参考訳): 自己教師付き学習(SSL)は、ラベルのないデータから堅牢な表現を学習する驚くべき能力を示しているが、最適のSSL戦略の選択は、特殊なドメインにおいて、非常に異なるパフォーマンス結果をもたらす可能性がある。
JEA(Joint Embedding Architectures)とJEPA(Joint Embedding Prediction Architectures)は、ピクセル再構成に基づくSSL法と比較して、ノイズやセマンティックな特徴学習の堅牢性を示し、医用画像に広く採用されている。
しかしながら、SSLの目的が臨床的に関連した信号の空間的構造に適合するかどうかを体系的に調査する以前の研究は行われていない。
本研究では,SSL法の選択が医学画像における学習表現にどのように影響するかを実証的に検討する。
特有なノイズプロファイルを特徴とする2つの代表的な画像モダリティ(超音波と病理組織学)を選択した。
組織学のように情報伝達信号が空間的局所化される場合,JEAは視差の相違により,より効果的である。
対照的に、診断に関連のある情報が、例えば肝超音波におけるマクロな解剖などのグローバルに構造化されている場合、JEPAsは最適である。
これらの違いは、ボード認定放射線学者や病理学者によって独立に検証されるように、学習した特徴の臨床的関連性において特に顕著である。
本研究は,医用画像モダリティの構造と雑音特性にSSLの目的を合わせるための枠組みを提供する。
関連論文リスト
- OTCXR: Rethinking Self-supervised Alignment using Optimal Transport for Chest X-ray Analysis [6.4136876268620115]
自己教師付き学習(SSL)は,X線などの医学的モダリティを解析するための有望な手法として登場した。
我々は,OTCXRを提案する。OTCXRは最適なトランスポート(OT)を利用して,密接なセマンティック不変性を学習する新しいSSLフレームワークである。
我々はOTCXRの有効性を3つの公開胸部X線データセットの総合的な実験により検証した。
論文 参考訳(メタデータ) (2024-04-18T02:59:48Z) - Overcoming Dimensional Collapse in Self-supervised Contrastive Learning
for Medical Image Segmentation [2.6764957223405657]
医用画像解析分野へのコントラスト学習の適用について検討する。
以上の結果から,最先端のコントラスト学習手法であるMoCo v2は,医用画像に適用すると次元的崩壊に遭遇することが明らかとなった。
これを解決するために,局所的な特徴学習と特徴デコレーションという2つの重要な貢献を提案する。
論文 参考訳(メタデータ) (2024-02-22T15:02:13Z) - Show from Tell: Audio-Visual Modelling in Clinical Settings [58.88175583465277]
臨床環境でのオーディオ・ビジュアル・モデリングを考察し、人間の専門的アノテーションを使わずに医学的表現を学習するためのソリューションを提供する。
この目的のために, 単純かつ効果的なマルチモーダル自己教師型学習フレームワークを提案する。
提案手法は,音声のみを基準として,超音波画像中の解剖学的関心領域をローカライズすることができる。
論文 参考訳(メタデータ) (2023-10-25T08:55:48Z) - K-Space-Aware Cross-Modality Score for Synthesized Neuroimage Quality
Assessment [71.27193056354741]
クロスモダリティな医用画像合成をどう評価するかという問題は、ほとんど解明されていない。
本稿では,この課題の進展を促すため,新しい指標K-CROSSを提案する。
K-CROSSは、トレーニング済みのマルチモードセグメンテーションネットワークを使用して、病変の位置を予測する。
論文 参考訳(メタデータ) (2023-07-10T01:26:48Z) - PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文 参考訳(メタデータ) (2023-01-02T17:47:27Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。