論文の概要: Efficient Chest X-ray Representation Learning via Semantic-Partitioned Contrastive Learning
- arxiv url: http://arxiv.org/abs/2603.07113v1
- Date: Sat, 07 Mar 2026 08:52:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.886941
- Title: Efficient Chest X-ray Representation Learning via Semantic-Partitioned Contrastive Learning
- Title(参考訳): 意味的分割型コントラスト学習による効率的な胸部X線表現学習
- Authors: Wangyu Feng, Shawn Young, Lijian Xu,
- Abstract要約: 自己教師付き学習(SSL)は,Chest X-ray(CXR)分析のための強力なパラダイムとして,限定アノテーションの下で登場した。
マスク付き画像モデリングは、診断値に制限のある高周波背景の詳細を再構成するために、かなりの計算を割り当てる。
CXR表現学習に適した効率的な事前学習フレームワークであるSemantic-Partitioned Contrastive Learning (S-PCL)を紹介する。
- 参考スコア(独自算出の注目度): 0.7901604416781479
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-supervised learning (SSL) has emerged as a powerful paradigm for Chest X-ray (CXR) analysis under limited annotations. Yet, existing SSL strategies remain suboptimal for medical imaging. Masked image modeling allocates substantial computation to reconstructing high-frequency background details with limited diagnostic value. Contrastive learning, on the other hand, often depends on aggressive augmentations that risk altering clinically meaningful structures. We introduce Semantic-Partitioned Contrastive Learning (S-PCL), an efficient pre-training framework tailored for CXR representation learning. Instead of reconstructing pixels or relying on heavy augmentations, S-PCL randomly partitions patch tokens from a single CXR into two non-overlapping semantic subsets. Each subset provides a complementary but incomplete view. The encoder must maximize agreement between these partitions, implicitly inferring global anatomical layout and local pathological cues from partial evidence. This semantic partitioning forms an internal bottleneck that enforces long-range dependency modeling and structural coherence. S-PCL eliminates the need for hand-crafted augmentations, auxiliary decoders, and momentum encoders. The resulting architecture is streamlined, computationally efficient, and easy to scale. Extensive experiments on large-scale CXR benchmarks, including ChestX-ray14, CheXpert, RSNA Pneumonia and SIIM-ACR Pneumothorax, show that S-PCL achieves competitive performance while attaining the lowest GFLOPs and superior accuracy among existing SSL approaches.
- Abstract(参考訳): 自己教師付き学習(SSL)は,Chest X-ray(CXR)分析のための強力なパラダイムとして,限定アノテーションの下で登場した。
しかし、既存のSSL戦略は医療画像に最適である。
マスク付き画像モデリングは、診断値に制限のある高周波背景の詳細を再構成するために、かなりの計算を割り当てる。
一方、対照的な学習は、しばしば、臨床的に意味のある構造を変えるリスクを負う攻撃的な増強に依存する。
CXR表現学習に適した効率的な事前学習フレームワークであるSemantic-Partitioned Contrastive Learning (S-PCL)を紹介する。
S-PCLはピクセルの再構築や重い拡張に頼る代わりに、1つのCXRからのパッチトークンを2つの非重複セマンティックサブセットにランダムに分割する。
各部分集合は相補的だが不完全である。
エンコーダはこれらの分割間の合意を最大化し、部分的な証拠から大局的な解剖学的レイアウトと局所的な病理的手がかりを暗黙的に推測しなければならない。
このセマンティックパーティショニングは、長期依存モデリングと構造コヒーレンスを強制する内部ボトルネックを形成する。
S-PCLは手作りの強化、補助デコーダ、モーメントエンコーダを必要としない。
結果として得られるアーキテクチャは、合理化され、計算効率が良く、スケールしやすい。
ChestX-ray14, CheXpert, RSNA Pneumonia, SIIM-ACR Pneumothoraxなどの大規模CXRベンチマークの大規模な実験により、S-PCLはGFLOPよりも低い精度と既存のSSLアプローチよりも優れた精度で競争力を発揮することが示された。
関連論文リスト
- Multi-task Cross-modal Learning for Chest X-ray Image Retrieval [1.8648093673053043]
医用検索タスクにCLIPとBiomedCLIPを微調整するマルチタスク学習フレームワークを提案する。
微調整モデルにより,画像・テキスト・画像検索とテキスト・画像検索の双方において,よりバランスよく,臨床的に有意な性能が得られることを示す。
これらの知見は, バイオメディカル応用におけるクロスモーダル検索の進歩に, ドメイン適応型マルチタスク学習の意義を浮き彫りにしている。
論文 参考訳(メタデータ) (2026-01-08T21:44:00Z) - AnyCXR: Human Anatomy Segmentation of Chest X-ray at Any Acquisition Position using Multi-stage Domain Randomized Synthetic Data with Imperfect Annotations and Conditional Joint Annotation Regularization Learning [0.0]
我々は任意のCXR射影角をまたいで一般化可能な多臓器分割を可能にする統一フレームワークであるAnyCXRを提案する。
我々はAnyCXRを完全に合成データに基づいて訓練し,PA,側方,斜視で54の解剖学的構造を正確に記述した。
その結果,AnyCXRは解剖学的CXR解析のためのスケーラブルで信頼性の高い基盤を確立していることがわかった。
論文 参考訳(メタデータ) (2025-12-19T06:27:14Z) - Cancer-Net PCa-MultiSeg: Multimodal Enhancement of Prostate Cancer Lesion Segmentation Using Synthetic Correlated Diffusion Imaging [55.62977326180104]
前立腺癌病変の分節化に対する近年の深層学習アプローチは,限られた性能を達成している。
本稿では,標準拡散型プロトコルの拡張として,合成相関拡散イメージング(CDI$s$)について検討する。
以上の結果から,PCa病変セグメント化タスクの実践的ドロップイン強化として,CDI$s$に対する検証済み統合経路が確立された。
論文 参考訳(メタデータ) (2025-11-11T04:16:12Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - DiSSECT: Structuring Transfer-Ready Medical Image Representations through Discrete Self-Supervision [9.254163621425727]
DiSSECTはSSLパイプラインにマルチスケールベクトル量子化を統合するフレームワークで、離散的な表現ボトルネックを課す。
分類タスクとセグメンテーションタスクの両方で強力なパフォーマンスを実現し、微調整は最小か不要である。
複数の公開医用画像データセットにまたがってDiSSECTを検証し、その堅牢性と一般化性を示す。
論文 参考訳(メタデータ) (2025-09-23T07:58:21Z) - OTCXR: Rethinking Self-supervised Alignment using Optimal Transport for Chest X-ray Analysis [6.4136876268620115]
自己教師付き学習(SSL)は,X線などの医学的モダリティを解析するための有望な手法として登場した。
我々は,OTCXRを提案する。OTCXRは最適なトランスポート(OT)を利用して,密接なセマンティック不変性を学習する新しいSSLフレームワークである。
我々はOTCXRの有効性を3つの公開胸部X線データセットの総合的な実験により検証した。
論文 参考訳(メタデータ) (2024-04-18T02:59:48Z) - MLVICX: Multi-Level Variance-Covariance Exploration for Chest X-ray Self-Supervised Representation Learning [6.4136876268620115]
MLVICXは、胸部X線画像からの埋め込みの形でリッチな表現をキャプチャするアプローチである。
自己教師付き胸部X線表現学習におけるMLVICXの性能を示す。
論文 参考訳(メタデータ) (2024-03-18T06:19:37Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - PCRLv2: A Unified Visual Information Preservation Framework for
Self-supervised Pre-training in Medical Image Analysis [56.63327669853693]
本稿では,ピクセルレベルの情報を高レベルなセマンティクスに明示的にエンコードするための画素復元タスクを提案する。
また,画像理解を支援する強力なツールであるスケール情報の保存についても検討する。
提案されている統合SSLフレームワークは、さまざまなタスクで自己管理されたフレームワークを超越している。
論文 参考訳(メタデータ) (2023-01-02T17:47:27Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Two-Stage Self-Supervised Cycle-Consistency Network for Reconstruction
of Thin-Slice MR Images [62.4428833931443]
太いスライス磁気共鳴(MR)画像は、しばしば冠状および矢状視で構造的にぼやけている。
深層学習は、これらの低分解能(LR)症例から高分解能(HR)薄膜MR画像を再構築する大きな可能性を示している。
MRスライス再構成のための2段階自己監督型サイクル一貫性ネットワーク(TSCNet)を提案する。
論文 参考訳(メタデータ) (2021-06-29T13:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。