論文の概要: DiSSECT: Structuring Transfer-Ready Medical Image Representations through Discrete Self-Supervision
- arxiv url: http://arxiv.org/abs/2509.18765v1
- Date: Tue, 23 Sep 2025 07:58:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.763083
- Title: DiSSECT: Structuring Transfer-Ready Medical Image Representations through Discrete Self-Supervision
- Title(参考訳): DiSSECT:離散自己スーパービジョンによる転送可能な医用画像の構造化
- Authors: Azad Singh, Deepak Mishra,
- Abstract要約: DiSSECTはSSLパイプラインにマルチスケールベクトル量子化を統合するフレームワークで、離散的な表現ボトルネックを課す。
分類タスクとセグメンテーションタスクの両方で強力なパフォーマンスを実現し、微調整は最小か不要である。
複数の公開医用画像データセットにまたがってDiSSECTを検証し、その堅牢性と一般化性を示す。
- 参考スコア(独自算出の注目度): 9.254163621425727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised learning (SSL) has emerged as a powerful paradigm for medical image representation learning, particularly in settings with limited labeled data. However, existing SSL methods often rely on complex architectures, anatomy-specific priors, or heavily tuned augmentations, which limit their scalability and generalizability. More critically, these models are prone to shortcut learning, especially in modalities like chest X-rays, where anatomical similarity is high and pathology is subtle. In this work, we introduce DiSSECT -- Discrete Self-Supervision for Efficient Clinical Transferable Representations, a framework that integrates multi-scale vector quantization into the SSL pipeline to impose a discrete representational bottleneck. This constrains the model to learn repeatable, structure-aware features while suppressing view-specific or low-utility patterns, improving representation transfer across tasks and domains. DiSSECT achieves strong performance on both classification and segmentation tasks, requiring minimal or no fine-tuning, and shows particularly high label efficiency in low-label regimes. We validate DiSSECT across multiple public medical imaging datasets, demonstrating its robustness and generalizability compared to existing state-of-the-art approaches.
- Abstract(参考訳): 自己教師付き学習(SSL)は、医学画像表現学習の強力なパラダイムとして、特にラベル付きデータを限定した設定で登場した。
しかし、既存のSSLメソッドは、しばしば複雑なアーキテクチャ、解剖学的特有な事前、あるいは高度に調整された拡張に依存し、スケーラビリティと一般化性を制限する。
より重要なことは、これらのモデルは学習をショートカットする傾向があり、特に胸部X線のような解剖学的類似度が高く、病理学は微妙である。
In this work, we introduced DiSSECT -- Discrete Self-Supervision for Efficient Clinical Transferable Representations, a framework that integrated a multi-scale vector Quantization into the SSL pipeline。
これにより、ビュー固有の、または低ユーティリティなパターンを抑えながら、繰り返し可能な、構造を意識した特徴を学習し、タスクやドメイン間の表現転送を改善することができる。
DiSSECTは、分類タスクとセグメンテーションタスクの両方で強力なパフォーマンスを達成し、微調整を必要とせず、低ラベルのレギュレーションにおいて特に高いラベル効率を示す。
複数の公開医用画像データセットにまたがってDiSSECTを検証し、既存の最先端のアプローチと比較して、その堅牢性と一般化性を実証した。
関連論文リスト
- SegMoTE: Token-Level Mixture of Experts for Medical Image Segmentation [18.723160085156717]
医用画像セグメンテーションのための効率的かつ適応的なフレームワークであるSegMoTEを提案する。
SegMoTEはSAMの本来のプロンプトインタフェース、効率的な推論、ゼロショットの一般化を保存している。
SegMoTEは、多様な画像モダリティと解剖学的タスクにわたってSOTA性能を達成する。
論文 参考訳(メタデータ) (2026-02-22T14:48:42Z) - Vision Foundry: A System for Training Foundational Vision AI Models [0.0]
Vision FoundryはコードフリーのHIPAA準拠のプラットフォームで、ビジョンモデルの事前トレーニング、適応、デプロイを民主化する。
高度な表現学習と実践的応用のギャップを埋めることで、Vision Foundryはドメインの専門家が最先端の臨床AIツールを開発することを可能にする。
論文 参考訳(メタデータ) (2025-12-03T14:02:22Z) - MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.74482877175797]
MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。
TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文 参考訳(メタデータ) (2025-11-13T06:30:41Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - MS-CLR: Multi-Skeleton Contrastive Learning for Human Action Recognition [49.91188543847175]
Multi-Skeleton Contrastive Learning (MS-CLR)は、同じシーケンスから抽出された複数のスケルトン規則間でポーズ表現を整列するフレームワークである。
MS-CLRは、強いシングルスケルトンコントラスト学習ベースラインよりも一貫してパフォーマンスを向上する。
マルチスケルトンアンサンブルはパフォーマンスをさらに向上させ、両方のデータセットに新たな最先端結果を設定する。
論文 参考訳(メタデータ) (2025-08-20T17:58:03Z) - Multimodal Causal-Driven Representation Learning for Generalizable Medical Image Segmentation [56.52520416420957]
医用画像セグメンテーションにおける領域一般化に取り組むために, MCDRL(Multimodal Causal-Driven Representation Learning)を提案する。
MCDRLは競合する手法より一貫して優れ、セグメンテーション精度が優れ、堅牢な一般化性を示す。
論文 参考訳(メタデータ) (2025-08-07T03:41:41Z) - HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - Leveraging Vision-Language Embeddings for Zero-Shot Learning in Histopathology Images [7.048241543461529]
ゼロショット組織像分類におけるこれらの課題に対処するため, MR-PHE(Multi-Resolution Prompt-Guided Hybrid Embedding)と呼ばれる新しいフレームワークを提案する。
我々は,グローバルな画像埋め込みと重み付けされたパッチ埋め込みを統合したハイブリッドな埋め込み戦略を導入する。
類似性に基づくパッチ重み付け機構は、クラス埋め込みとの関連性に基づいて、アテンションのような重み付けをパッチに割り当てる。
論文 参考訳(メタデータ) (2025-03-13T12:18:37Z) - Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation [30.524999223901645]
完全教師なし方式で生成されるアノテーション効率のよいプロンプトを利用するSAM(Segment Anything Model)フレームワークを提案する。
我々は、モデルが高忠実度セグメンテーションを生成できるように最適なポリシーを設計するために、直接選好最適化手法を採用する。
X線, 超音波, 腹部CTなど多彩な領域にわたる肺分節, 乳房腫瘍分節, 臓器分節などのタスクにおける我々のフレームワークの最先端性能は, 低アノテーションデータシナリオにおけるその有効性を正当化するものである。
論文 参考訳(メタデータ) (2025-03-06T17:28:48Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - OTCXR: Rethinking Self-supervised Alignment using Optimal Transport for Chest X-ray Analysis [6.4136876268620115]
自己教師付き学習(SSL)は,X線などの医学的モダリティを解析するための有望な手法として登場した。
我々は,OTCXRを提案する。OTCXRは最適なトランスポート(OT)を利用して,密接なセマンティック不変性を学習する新しいSSLフレームワークである。
我々はOTCXRの有効性を3つの公開胸部X線データセットの総合的な実験により検証した。
論文 参考訳(メタデータ) (2024-04-18T02:59:48Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。