論文の概要: Scaling In-Context Segmentation with Hierarchical Supervision
- arxiv url: http://arxiv.org/abs/2604.12752v1
- Date: Tue, 14 Apr 2026 14:00:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.475015
- Title: Scaling In-Context Segmentation with Hierarchical Supervision
- Title(参考訳): 階層的スーパービジョンによる文脈内セグメンテーションのスケーリング
- Authors: T. Camaret Ndir, Marco Reisert, Robin T. Schirrmeister,
- Abstract要約: コンテキスト内学習により、医療画像セグメンテーションモデルは新しい解剖学的構造に適応できる。
我々は、選択的な画像パッチとマルチレベル監視を組み合わせた階層的なフレームワークであるPatchICLを提案する。
強力なグローバルアテンションベースラインであるUniverSegと比較して、PatchICLは、競合するドメイン内CTセグメンテーションの精度を実現し、計算を512times512$で44%削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In-context learning (ICL) enables medical image segmentation models to adapt to new anatomical structures from limited examples, reducing the clinical annotation burden. However, standard ICL methods typically rely on dense, global cross-attention, which scales poorly with image resolution. While recent approaches have introduced localized attention mechanisms, they often lack explicit supervision on the selection process, leading to redundant computation in non-informative regions. We propose PatchICL, a hierarchical framework that combines selective image patching with multi-level supervision. Our approach learns to actively identify and attend only to the most informative anatomical regions. Compared to UniverSeg, a strong global-attention baseline, PatchICL achieves competitive in-domain CT segmentation accuracy while reducing compute by 44\% at $512\times512$ resolution. On 35 out-of-domain datasets spanning diverse imaging modalities, PatchICL outperforms the baseline on 6 of 13 modality categories, with particular strength on modalities dominated by localized pathology such as OCT and dermoscopy. Training and evaluation code are available at https://github.com/tidiane-camaret/ic_segmentation
- Abstract(参考訳): In-context Learning (ICL)により、医学的画像分割モデルが限られた例から新しい解剖学的構造に適応し、臨床診断の負担を軽減できる。
しかし、標準のICL法は、画像解像度に劣る、密集した大域的横断性に依存するのが一般的である。
近年のアプローチでは、局所的な注意機構を導入しているが、選択プロセスに対する明示的な監督が欠如しており、非表現的領域における冗長な計算につながっている。
我々は、選択的な画像パッチとマルチレベル監視を組み合わせた階層的なフレームワークであるPatchICLを提案する。
我々のアプローチは、最も情報に富む解剖学的領域のみを積極的に同定し、参加することを学ぶ。
強力なグローバルアテンションベースラインであるUniverSegと比較して、PatchICLは、計算を512\times512$で44\%削減しながら、競合するドメイン内CTセグメンテーションの精度を実現している。
多様な画像モダリティにまたがる35のドメイン外データセットにおいて、PatchICLは13のモダリティカテゴリのうち6のベースラインを上回り、特にOCTや皮膚内視鏡のような局所的な病理に支配されるモダリティに強い。
トレーニングと評価コードはhttps://github.com/tidiane-camaret/ic_segmentationで公開されている。
関連論文リスト
- MedSAD-CLIP: Supervised CLIP with Token-Patch Cross-Attention for Medical Anomaly Detection and Segmentation [1.055294253870608]
医学的異常検出(MAD)とセグメンテーション(セグメンテーション)は臨床診断を補助する重要な役割を担っている。
最近のCLIPベースの研究は、ゼロ/フェーショット設定における異常検出を約束している。
現実的な臨床環境下でのMADに対するCLIPの適応について検討した。
論文 参考訳(メタデータ) (2026-03-18T03:37:44Z) - XAI-CLIP: ROI-Guided Perturbation Framework for Explainable Medical Image Segmentation in Multimodal Vision-Language Models [4.5236257764997205]
XAI-CLIPは、医療画像セグメンテーションのためのROI誘導摂動フレームワークである。
言語インフォームド・リージョンのローカライゼーションと医療画像のセグメンテーションを統合し、ターゲットとなる地域対応の摂動を適用します。
XAI-CLIPは最大60%のランタイム削減、44.6%のダイススコアの改善、96.7%のIntersection-over-Unionを実現している。
論文 参考訳(メタデータ) (2026-02-01T00:27:06Z) - GCA-ResUNet: Medical Image Segmentation Using Grouped Coordinate Attention [3.6679095759171645]
GCA-ResUNetは、軽量でプラグ&プレイのGrouped Coordinate Attention (GCA)モジュールを備えた効率的な医用画像セグメンテーションフレームワークである。
Synapse と ACDC の2つの広く使われているベンチマークによる大規模な実験では、それぞれ GCA-ResUNet が 86.11% と 92.64% のDice のスコアを達成している。
論文 参考訳(メタデータ) (2025-12-30T05:13:20Z) - TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Contrastive Semi-supervised Learning for Domain Adaptive Segmentation
Across Similar Anatomical Structures [21.54339967787734]
クロス解剖領域適応のためのコントラスト半教師付き学習を提案する。
モデルを適用して、類似した構造をターゲットドメインに分割する。
ターゲットドメインで限定的なアノテーションのみを必要とする。
論文 参考訳(メタデータ) (2022-08-18T02:54:04Z) - Inconsistency-aware Uncertainty Estimation for Semi-supervised Medical
Image Segmentation [92.9634065964963]
我々は、不確実性推定と個別の自己学習戦略に基づいて、新しい半教師付きセグメンテーションモデル、すなわち保守的ラディカルネットワーク(CoraNet)を提案する。
現在の技術と比較すると、ColaNetは優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-10-17T08:49:33Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Max-Fusion U-Net for Multi-Modal Pathology Segmentation with Attention
and Dynamic Resampling [13.542898009730804]
関連するアルゴリズムの性能は、マルチモーダル情報の適切な融合によって大きく影響を受ける。
We present the Max-Fusion U-Net that achieve a improve pathology segmentation performance。
マルチシーケンスCMRデータセットを併用したMyoPS(Myocardial pathology segmentation)を用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-09-05T17:24:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。