論文の概要: Beyond Instance-Level Self-Supervision in 3D Multi-Modal Medical Imaging
- arxiv url: http://arxiv.org/abs/2605.14654v1
- Date: Thu, 14 May 2026 10:10:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.770267
- Title: Beyond Instance-Level Self-Supervision in 3D Multi-Modal Medical Imaging
- Title(参考訳): 3次元マルチモーダル・メディカルイメージングにおけるインスタンスレベルセルフスーパービジョンを超えて
- Authors: Tan Pan, Shuhao Mei, Yixuan Sun, Kaiyu Guo, Chen Jiang, Zhaorui Tan, Mengzhu Li, Limei Han, Xiang Zou, Yuan Cheng, Mahsa Baktashmotlagh,
- Abstract要約: 医用画像における自己監督型事前訓練法は、通常、個人を孤立した例として扱う。
本稿では、このクロスインスタンス・トポロジ的一貫性を監視信号として活用することを提案する。
我々は,7つの下流マルチモーダルタスクに対するアプローチを検証し,セグメンテーションおよび分類タスクにおける平均1.1%と5.94%の改善を実現した。
- 参考スコア(独自算出の注目度): 29.556385532527752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised pre-training methods in medical imaging typically treat each individual as an isolated instance, learning representations through augmentation-based objectives or masked reconstruction. They often do not adequately capitalize on a key characteristic of physiological features: anatomical structures maintain consistent spatial relationships across individuals (instances), such as the thalamus being medial to the basal ganglia, regardless of variations in brain size, shape, or pathology. We propose leveraging this cross-instance topological consistency as a supervisory signal. The challenge arises from the inherent variability in medical imaging, which can differ significantly across instances and modalities. To tackle this, we focus on two alignment regimes. (i) Intra-instance: with pixel-level correspondences available, a cross-modal triplet objective explicitly preserves local neighborhood topology. (ii) Inter-instance: without such supervision, we derive pseudo-correspondences to control partial neighborhood alignment and prevent topology collapse across modalities. We validate our approach across 7 downstream multi-modal tasks, achieving average improvements of 1.1% and 5.94% in segmentation and classification tasks, respectively, and demonstrating significantly better robustness when modalities are missing at test time.
- Abstract(参考訳): 医用画像における自己監督型事前訓練法は、通常、個人を孤立した例として扱い、拡張に基づく目的やマスク付き再構成を通して表現を学ぶ。
解剖学的構造は、脳の大きさ、形状、病理のばらつきに関わらず、視床が基底神経節に媒介されるなど、個人(インスタンス)間で一貫した空間的関係を維持する。
本稿では、このクロスインスタンス・トポロジ的一貫性を監視信号として活用することを提案する。
この課題は、医療画像における固有の多様性から生じており、インスタンスやモダリティによって大きく異なる可能性がある。
これに取り組むために、我々は2つのアライメント体制に焦点を当てる。
i) イントラインスタンス: ピクセルレベルの対応が利用可能である場合, クロスモーダル三重項は局所的に局所的なトポロジーを明示的に保存する。
(II)インタースタンス:このような監督がなければ,部分的な近傍アライメントを制御し,モダリティ間のトポロジー崩壊を防止するために,擬似対応を導出する。
我々は,7つの下流マルチモーダルタスクにまたがるアプローチを検証し,セグメンテーションおよび分類タスクにおける平均1.1%と5.94%の改善を実現した。
関連論文リスト
- Multicentric thrombus segmentation using an attention-based recurrent network with gradual modality dropout [0.0]
注意に基づく繰り返しセグメンテーションネットワーク(UpAttLLSTM)を結合する手法を提案する。
UpAttLLSTMは、リカレントユニット(2.5D)を介してコンテキストを集約し、アテンションゲートを使用して、利用可能なシーケンス間で補完的なキューを融合する。
単中心コホートでは,Diceスコア0.65の症例の90%以上でトロンビを検出する。
モダリティを欠いたマルチセンター環境では、Diceスコアで約0.35で80%の検知を実現している。
論文 参考訳(メタデータ) (2026-04-01T12:25:00Z) - PF-DAformer: Proximal Femur Segmentation via Domain Adaptive Transformer for Dual-Center QCT [8.358409792893278]
多施設定量的CT(QCT)に適したドメイン適応型トランスフォーマーセグメンテーションフレームワークを開発した。
当モデルでは, タラネ大学から1024個のQCT画像スキャン, ミネソタ州ロチェスターから384個の画像スキャンを行い, 大腿骨近位部セグメンテーションを行った。
論文 参考訳(メタデータ) (2025-10-30T18:07:56Z) - A Dual-Task Synergy-Driven Generalization Framework for Pancreatic Cancer Segmentation in CT Scans [10.62594407632477]
膵癌は、その顕著な有病率と死亡率によって特徴づけられ、正確な病変の脱線を要求される。
本稿では, ピクセルレベルの分類と回帰処理を相乗化して, 病変を正確に記述する一般化フレームワークを提案する。
膵癌分節タスクの難易度を9.51%改善した。
論文 参考訳(メタデータ) (2025-05-03T00:54:00Z) - Pre-trained Models Succeed in Medical Imaging with Representation Similarity Degradation [6.545152478351316]
本研究は,表現類似性軌跡の定量化と解析を中心とした厳密な問題定義を確立する。
実験結果から,タスクの精度と事前学習した起源との類似性の両方を保った高性能モデルが存在する可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-11T01:37:54Z) - MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [57.044719143401664]
病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-03-01T07:02:30Z) - Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels [54.58539616385138]
我々は、Mine yOur owN Anatomy (MONA) と呼ばれる、新しい半教師付き2次元医用画像セグメンテーションフレームワークを紹介する。
まず、先行研究では、すべてのピクセルがモデルトレーニングに等しく重要であると論じており、我々はこの1つだけで意味のある解剖学的特徴を定義できないことを経験的に観察している。
第2に,医療画像を解剖学的特徴の集合に分解できるモデルを構築する。
論文 参考訳(メタデータ) (2022-09-27T15:50:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。