論文の概要: SemiSAM-O1: How far can we push the boundary of annotation-efficient medical image segmentation?
- arxiv url: http://arxiv.org/abs/2604.24109v1
- Date: Mon, 27 Apr 2026 07:04:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.779802
- Title: SemiSAM-O1: How far can we push the boundary of annotation-efficient medical image segmentation?
- Title(参考訳): SemiSAM-O1: アノテーション効率のよい医用画像セグメンテーションの境界をどこまで進めることができるか?
- Authors: Yichi Zhang, Le Xue, Bichun Xu, Judong Luo, Zhigang Wu, Yu Fu, Zixin Hu, Yuan Cheng, Yuan Qi,
- Abstract要約: SemiSAM-O1はアノテーション効率のよいフレームワークであり、セグメンテーションのために1つの注釈付きテンプレートイメージのみを使用する。
幅広いセグメンテーションタスクの実験により、SemiSAM-O1は1ラベルの半教師付き学習と全監督の間のパフォーマンスギャップを著しく狭めることが示された。
- 参考スコア(独自算出の注目度): 25.101921825239533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning (SSL) has become a promising solution to alleviate the annotation burden of deep learning-based medical image segmentation models. While recent advances in foundation model-driven SSL have pushed the boundary to extremely limited annotation scenarios, they fail to maintain robust competitive performance in complex imaging modalities. In this paper, we propose SemiSAM-O1, an annotation-efficient framework using only one annotated template image for segmentation. SemiSAM-O1 extends the specialist-generalist collaborative learning framework to the extreme one-label setting by fully exploiting the foundation model's feature representation capability beyond its prompting interface. SemiSAM-O1 operates in two stages. In the first stage, the foundation model's encoder extracts dense features from all volumes, and class prototypes derived from the single annotated template are propagated to the unlabeled pool via feature similarity to produce coarse initial pseudo-labels. In the second stage, an iterative training-and-refinement loop progressively improves both the segmentation model and the pseudo-labels over multiple rounds, where each round trains the model from scratch on current pseudo-labels and generates updated predictions with voxel-wise uncertainty estimates. An uncertainty-guided refinement step further leverages the foundation model's global feature space to correct high-uncertainty regions by aggregating labels from their most similar confident neighbors, establishing a virtuous cycle of mutual improvement. Extensive experiments on a wide range of segmentation tasks across different modalities and anatomical targets demonstrate that SemiSAM-O1 significantly narrows the performance gap between one-label semi-supervised learning and full supervision, while significantly reducing the computational overhead of online foundation model inference.
- Abstract(参考訳): 半教師付き学習(SSL)は、深層学習に基づく医用画像セグメンテーションモデルのアノテーション負担を軽減するための有望なソリューションとなっている。
基盤モデル駆動SSLの最近の進歩は、境界を極めて限定的なアノテーションシナリオに押し上げたが、複雑な画像モダリティにおいて堅牢な競合性能を維持するには至らなかった。
本稿では,セグメンテーションのための注釈付きテンプレート画像のみを用いたアノテーション効率の高いフレームワークであるSemiSAM-O1を提案する。
SemiSAM-O1は、ファウンデーションモデルの特徴表現能力をプロンプトインターフェースを超えて完全に活用することで、専門家と一般の協調学習フレームワークを極端な1ラベル設定にまで拡張する。
SemiSAM-O1は2段階で動作する。
第1段階では、ファンデーションモデルのエンコーダが全ボリュームから密集した特徴を抽出し、単一の注釈付きテンプレートから派生したクラスプロトタイプを特徴類似性を介して未ラベルのプールに伝播し、粗い初期擬似ラベルを生成する。
第2段階では、反復的トレーニング・リファインメントループは、分割モデルと擬似ラベルの両方を複数のラウンドで段階的に改善し、各ラウンドは現在の擬似ラベルのスクラッチからモデルを訓練し、ボクセルワイズな不確実性推定を伴う最新の予測を生成する。
不確実性誘導による改善のステップは、基礎モデルのグローバルな特徴空間を利用して、最も類似した自信のある隣人からラベルを集約し、相互改善の活発なサイクルを確立することによって、高不確実性領域を補正する。
その結果,SemiSAM-O1は1ラベルの半教師付き学習と完全教師付き学習とのパフォーマンスギャップを著しく狭くし,オンライン基礎モデル推論の計算オーバーヘッドを大幅に減らした。
関連論文リスト
- Toward Stable Semi-Supervised Remote Sensing Segmentation via Co-Guidance and Co-Fusion [31.189038928192648]
Co2Sは半教師付きRSセグメンテーションフレームワークで、ビジョン言語モデルと自己教師型モデルとを融合する。
テキスト埋め込みと学習可能なクエリを利用した,明示的でシンプルなセマンティックコガイダンス機構が導入された。
6つの一般的なデータセットに対する実験は,提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2025-12-28T18:24:19Z) - Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.14752758616364]
音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文 参考訳(メタデータ) (2025-10-05T09:32:12Z) - ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - Segment Concealed Objects with Incomplete Supervision [63.637733655439334]
不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。
このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。
本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文 参考訳(メタデータ) (2025-06-10T16:25:15Z) - Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.12123628480371]
教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。
従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。
本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-27T13:58:12Z) - SemiSAM+: Rethinking Semi-Supervised Medical Image Segmentation in the Era of Foundation Models [23.402987690611827]
SemiSAM+は、医療画像セグメンテーションのための限定ラベル付きデータから効率的に学習する基盤モデル駆動SSLフレームワークである。
SemiSAM+は、ジェネラリストモデルとして1つまたは複数のプロンプト可能な基礎モデルと、専門家モデルとして訓練可能なタスク固有のセグメンテーションモデルで構成されている。
2つの公開データセットと1つの社内臨床データセットの実験は、SemiSAM+が大幅なパフォーマンス改善を実現していることを示している。
論文 参考訳(メタデータ) (2025-02-28T05:54:41Z) - Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。