論文の概要: SRA-Seg: Synthetic to Real Alignment for Semi-Supervised Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2602.02944v1
- Date: Tue, 03 Feb 2026 00:38:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.154935
- Title: SRA-Seg: Synthetic to Real Alignment for Semi-Supervised Medical Image Segmentation
- Title(参考訳): SRA-Seg : 半監督型医用画像分割のための合成とリアルアライメント
- Authors: OFM Riaz Rahman Aranya, Kevin Desai,
- Abstract要約: SRA-Segは、医用画像セグメンテーションのための合成および実際の特徴分布を調整するために設計されたフレームワークである。
柔らかいエッジブレンディングを用いて、スムーズな解剖学的遷移と連続的なラベルを作成します。
SRA-Seg は ACDC の89.34%、FIVES の84.42% を達成し、既存の半教師付き手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 4.726777092009554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data, an appealing alternative to extensive expert-annotated data for medical image segmentation, consistently fails to improve segmentation performance despite its visual realism. The reason being that synthetic and real medical images exist in different semantic feature spaces, creating a domain gap that current semi-supervised learning methods cannot bridge. We propose SRA-Seg, a framework explicitly designed to align synthetic and real feature distributions for medical image segmentation. SRA-Seg introduces a similarity-alignment (SA) loss using frozen DINOv2 embeddings to pull synthetic representations toward their nearest real counterparts in semantic space. We employ soft edge blending to create smooth anatomical transitions and continuous labels, eliminating the hard boundaries from traditional copy-paste augmentation. The framework generates pseudo-labels for synthetic images via an EMA teacher model and applies soft-segmentation losses that respect uncertainty in mixed regions. Our experiments demonstrate strong results: using only 10% labeled real data and 90% synthetic unlabeled data, SRA-Seg achieves 89.34% Dice on ACDC and 84.42% on FIVES, significantly outperforming existing semi-supervised methods and matching the performance of methods using real unlabeled data.
- Abstract(参考訳): 医用画像セグメンテーションのための豊富な専門家による注釈データに代わる魅力的なデータである合成データは、その視覚的リアリズムにもかかわらず、常にセグメンテーション性能を改善することができない。
合成医用画像と実際の医用画像が異なる意味的特徴空間に存在するため、現在の半教師あり学習方法ではブリッジできない領域ギャップが生じる。
SRA-Segは医用画像セグメンテーションのための合成特徴分布と実特徴分布を協調するように設計されたフレームワークである。
SRA-Segは、凍ったDINOv2埋め込みを用いて、セマンティック空間において最も近い実空間に向けて合成表現を引き出す類似性アライメント(SA)損失を導入した。
柔らかいエッジブレンディングを用いて、スムーズな解剖学的遷移と連続ラベルを作成し、従来のコピーペースト強化から硬い境界を排除した。
EMA教師モデルを用いて合成画像の擬似ラベルを生成し,混合領域の不確実性を考慮したソフトセグメンテーション損失を適用した。
SRA-Seg は ACDC で89.34% 、FIVES で84.42% を達成し、既存の半教師付き手法を著しく上回り、実際の未ラベルデータを用いた手法の性能に匹敵する結果を得た。
関連論文リスト
- SynMind: Reducing Semantic Hallucination in fMRI-Based Image Reconstruction [52.34513874272676]
既存の手法は、明示的な意味的アイデンティティよりも、絡み合った視覚的埋め込みに強く依存している、と我々は主張する。
我々はfMRI信号を、人間の視覚理解の階層的・構成的性質を反映したリッチで文レベルの意味記述に解析する。
そこで我々は,これらの明示的なセマンティックエンコーディングを視覚的プリエンプションと統合したフレームワークであるSynMindを提案する。
論文 参考訳(メタデータ) (2026-01-25T14:31:23Z) - Diffusion-Guided Mask-Consistent Paired Mixing for Endoscopic Image Segmentation [57.37991748282666]
本稿では, 試料混合と拡散合成の強度を融合した拡散誘導型パラダイムを提案する。
各実画像について、合成対を同じマスクの下で生成し、その対をマスク一貫性ペアドミキシング(MCPMix)の制御可能な入力として使用する。
これは、共有幾何学の下で合成および実際の外観を円滑にブリッジする中間サンプルの連続的な族を生成する。
論文 参考訳(メタデータ) (2025-11-05T06:14:19Z) - Latent Space Synergy: Text-Guided Data Augmentation for Direct Diffusion Biomedical Segmentation [2.4912767911151015]
テキスト誘導合成データ生成と効率的な拡散ベースセグメンテーションを組み合わせたフレームワークであるSynDiffを提案する。
本手法では, テキスト条件の塗布により, 臨床的にリアルな合成ポリープを生成するために, 潜時拡散モデルを用いている。
CVC-ClinicDBでは、SynDiffは96.4%のDiceと92.9%のIoUを達成した。
論文 参考訳(メタデータ) (2025-07-21T08:15:17Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - SemSim: Revisiting Weak-to-Strong Consistency from a Semantic Similarity Perspective for Semi-supervised Medical Image Segmentation [18.223854197580145]
医用画像分割のための半教師付き学習(SSL)は難しいが、非常に実践的な課題である。
セムシム(SemSim)という名前のFixMatchに基づく新しいフレームワークを提案する。
SemSimは3つの公開セグメンテーションベンチマークで最先端の手法よりも一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2024-10-17T12:31:37Z) - SAU: A Dual-Branch Network to Enhance Long-Tailed Recognition via Generative Models [9.340077455871736]
画像認識における長い尾の分布は、いくつかの支配階級間の深刻な不均衡のため、大きな課題となる。
近年,画像分類のための合成データ作成に大規模な生成モデルが用いられている。
本稿では,データ不均衡の影響を解消するために,長い尾のデータセットを補完する合成データを提案する。
論文 参考訳(メタデータ) (2024-08-29T05:33:59Z) - Unsupervised Synthetic Image Refinement via Contrastive Learning and
Consistent Semantic-Structural Constraints [32.07631215590755]
コントラスト学習(CL)は、相関したパッチをまとめて、非相関的なパッチを分離するのに成功している。
本研究では,合成画像と精細画像間の意味的・構造的整合性を利用して,意味的歪みを低減するためにCLを採用する。
論文 参考訳(メタデータ) (2023-04-25T05:55:28Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - You Only Need Adversarial Supervision for Semantic Image Synthesis [84.83711654797342]
我々は,高品質な結果を得るためには敵対的監督のみを必要とする,新しい簡易ganモデルを提案する。
本モデルによって合成された画像はより多様であり,実画像の色やテクスチャに密接に従っている。
論文 参考訳(メタデータ) (2020-12-08T23:00:48Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。