論文の概要: SegTTA: Training-Free Test-Time Augmentation for Zero-Shot Medical Imaging Segmentation
- arxiv url: http://arxiv.org/abs/2604.17451v1
- Date: Sun, 19 Apr 2026 14:05:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.530056
- Title: SegTTA: Training-Free Test-Time Augmentation for Zero-Shot Medical Imaging Segmentation
- Title(参考訳): ゼロショット・メディカル・イメージ・セグメンテーションのための無トレーニングテスト時間拡張
- Authors: Yihong Yao, Chunlei Li, Canxuan Gang, Wenzhi Hu, Zeyu Zhang, Hao Zhang, Xiaoyan Li,
- Abstract要約: SegTTAは、モデルの再トレーニングなしに、医療画像のセグメンテーションを改善するフレームワークである。
その結果,mIoUは1.6,aIoUは1.9,HD95は2.0であった。
- 参考スコア(独自算出の注目度): 17.443493692341445
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Increasingly advanced data augmentation techniques have greatly aided clinical medical research, increasing data diversity and improving model generalization capabilities. Although most current basic models exhibit strong generalization abilities, image quality varies due to differences in equipment and operators. To address these challenges, we present SegTTA, a framework that improves medical image segmentation without model retraining by combining four augmentations (Gamma correction, Contrast enhancement, Gaussian blur, Gaussian noise) with weighted voting across multiple MedSAM2 checkpoints. Experiments demonstrate consistent improvements across three diverse datasets: healthy uterus segmentation, uterine myoma detection, and multi class hepatic structure segmentation. Ablation studies reveal that large organs benefit from intensity augmentations while small lesions require noise augmentations. The voting threshold controls the coverage precision trade off, enabling task specific optimization for different clinical requirements. Ultimately, on a multiclass hepatic vessel dataset, compared to MedSAM2 baselines, our method achieves an increase of 1.6 in mIoU and 1.9 in aIoU, along with a reduction of approximately 2.0 in HD95. Code will be available at https://github.com/AIGeeksGroup/SegTTA.
- Abstract(参考訳): 高度なデータ拡張技術は、臨床医学研究を大いに支援し、データの多様性を高め、モデルの一般化能力を向上させる。
現在のほとんどの基本モデルは強力な一般化能力を示すが、機器と操作者の違いにより画質が変化する。
これらの課題に対処するため,Gamma correct, Contrast enhancement, Gaussian blur, Gaussian noise) の4つの拡張と,MedSAM2チェックポイント間の重み付き投票を組み合わせることで,モデル再構成なしで医療画像のセグメンテーションを改善するフレームワークであるSegTTAを提案する。
実験では、健康な子宮の分節、子宮筋腫の検出、マルチクラス肝組織分節という3つの多様なデータセットで一貫した改善が示されている。
アブレーションによる研究によると、大きな臓器は強度増強の恩恵を受ける一方、小さな病変はノイズ増強を必要とする。
投票閾値は、カバー精度のトレードオフを制御し、異なる臨床要件に対するタスク固有の最適化を可能にする。
いずれにせよ,MedSAM2ベースラインと比較すると,mIoUが1.6,aIoUが1.9,HD95が約2.0であった。
コードはhttps://github.com/AIGeeksGroup/SegTTAで入手できる。
関連論文リスト
- SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging [12.707029435622953]
本稿では拡散変圧器(DiT)に基づく新しいセグメンテーションモデルであるSegDTを紹介する。
SegDTは低コストのハードウェアで動作するように設計されており、推論ステップの削減で生成品質を改善するRectified Flowが組み込まれている。
この研究は、医療画像分析におけるディープラーニングモデルの性能と能力を向上し、医療専門家のためのより速く、より正確な診断ツールを可能にする。
論文 参考訳(メタデータ) (2025-07-21T13:18:05Z) - MedGemma Technical Report [75.88152277443179]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。
MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。
また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:01:44Z) - SSS: Semi-Supervised SAM-2 with Efficient Prompting for Medical Imaging Segmentation [18.41555492374031]
SSS(Semi-Supervised SAM-2)は、SAM-2の頑健な特徴抽出機能を活用して、ラベルなしの医療画像における潜在知識を明らかにする新しいアプローチである。
実験では、SSSはBHSD上での平均Diceスコアを53.15とし、+3.65Diceよりも上回っている。
論文 参考訳(メタデータ) (2025-06-10T16:09:40Z) - MedCLIP-SAMv2: Towards Universal Text-Driven Medical Image Segmentation [2.2585213273821716]
MedCLIP-SAMv2はCLIPとSAMモデルを統合して臨床スキャンのセグメンテーションを行う新しいフレームワークである。
提案手法は,DHN-NCE(Decoupled Hard Negative Noise Contrastive Estimation)によるBiomedCLIPモデルの微調整を含む。
また,ゼロショットセグメンテーションラベルを弱教師付きパラダイム内で使用することにより,セグメンテーション品質をさらに向上する。
論文 参考訳(メタデータ) (2024-09-28T23:10:37Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Analysis of Augmentations for Contrastive ECG Representation Learning [17.467589890017123]
本稿では,心電図(ECG)信号のコントラスト学習における各種拡張の有効性を系統的に検討する。
PTB-XLは、大規模で公開されている12リードのECGデータセットである。
論文 参考訳(メタデータ) (2022-05-30T20:41:59Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。