論文の概要: From Cold Start to Active Learning: Embedding-Based Scan Selection for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2601.18532v1
- Date: Mon, 26 Jan 2026 14:39:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.871513
- Title: From Cold Start to Active Learning: Embedding-Based Scan Selection for Medical Image Segmentation
- Title(参考訳): コールドスタートからアクティブラーニングへ:医療画像セグメンテーションのための埋め込み型スキャン選択
- Authors: Devon Levy, Bar Assayag, Laura Gaspar, Ilan Shimshoni, Bella Specktor-Fadida,
- Abstract要約: 本稿では,基礎モデル埋め込みとクラスタリングを組み合わせて,多様な初期訓練を構築する冷間開始型サンプリング戦略を提案する。
続いて、空間的多様性を統合してサンプル選択をガイドする不確実性に基づくALフレームワークが続く。
我々はX線とMRIを対象とする3つのデータセットに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 3.593289313036688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate segmentation annotations are critical for disease monitoring, yet manual labeling remains a major bottleneck due to the time and expertise required. Active learning (AL) alleviates this burden by prioritizing informative samples for annotation, typically through a diversity-based cold-start phase followed by uncertainty-driven selection. We propose a novel cold-start sampling strategy that combines foundation-model embeddings with clustering, including automatic selection of the number of clusters and proportional sampling across clusters, to construct a diverse and representative initial training. This is followed by an uncertainty-based AL framework that integrates spatial diversity to guide sample selection. The proposed method is intuitive and interpretable, enabling visualization of the feature-space distribution of candidate samples. We evaluate our approach on three datasets spanning X-ray and MRI modalities. On the CheXmask dataset, the cold-start strategy outperforms random selection, improving Dice from 0.918 to 0.929 and reducing the Hausdorff distance from 32.41 to 27.66 mm. In the AL setting, combined entropy and diversity selection improves Dice from 0.919 to 0.939 and reduces the Hausdorff distance from 30.10 to 19.16 mm. On the Montgomery dataset, cold-start gains are substantial, with Dice improving from 0.928 to 0.950 and Hausdorff distance decreasing from 14.22 to 9.38 mm. On the SynthStrip dataset, cold-start selection slightly affects Dice but reduces the Hausdorff distance from 9.43 to 8.69 mm, while active learning improves Dice from 0.816 to 0.826 and reduces the Hausdorff distance from 7.76 to 6.38 mm. Overall, the proposed framework consistently outperforms baseline methods in low-data regimes, improving segmentation accuracy.
- Abstract(参考訳): 正確なセグメンテーションアノテーションは病気のモニタリングには不可欠だが、時間と専門知識のために手動ラベリングが大きなボトルネックとなっている。
アクティブラーニング(AL)は、一般的に多様性に基づくコールドスタートフェーズと不確実性による選択を通じて、アノテーションのインフォメーションサンプルを優先順位付けすることで、この負担を軽減する。
本稿では,クラスタ数の自動選択やクラスタ間の比例サンプリングなど,基礎モデル埋め込みとクラスタリングを組み合わせた新たなコールドスタートサンプリング手法を提案する。
続いて、空間的多様性を統合してサンプル選択をガイドする不確実性に基づくALフレームワークが続く。
提案手法は直感的かつ解釈可能であり,候補標本の特徴空間分布の可視化を可能にする。
我々はX線とMRIを対象とする3つのデータセットに対するアプローチを評価した。
CheXmaskデータセットでは、コールドスタート戦略はランダム選択よりも優れ、Diceを0.918から0.929に改善し、Hausdorff距離を32.41から27.66mmに短縮した。
AL設定では、エントロピーと多様性の複合はディスを0.919から0.939に改善し、ハウスドルフ距離を30.10から19.16mmに短縮する。
モンゴメリーデータセットでは、ディースは0.928から0.950に改善され、ハウスドルフの距離は14.22から9.38mmに減少した。
シンスストリップのデータセットでは、コールドスタートの選択はディースにわずかに影響を及ぼすが、ハウスドルフ距離は9.43mmから8.69mmに減少し、アクティブラーニングはディースを0.816から0.826に改善し、ハウスドルフ距離は7.76から6.38mmに減少する。
全体として、提案するフレームワークは、低データレシエーションにおけるベースラインメソッドを一貫して上回り、セグメンテーション精度を向上する。
関連論文リスト
- Urban 3D Change Detection Using LiDAR Sensor for HD Map Maintenance and Smart Mobility [26.712098856567888]
都市規模LiDARのための物体中心型不確実性認識パイプラインを提案する。
これはエポックを多分解能NDTと整列し、次に点対平面ICP、高さを正規化し、位置検出レベルを導出する。
15代表のスービアコでは95.2%の精度、90.4%のmF1、82.6%のmIoUがトリプルトKPConvを超える精度、0.2のmF1、0.8のmIoUがブロックされ、IoUが74.8%に達し、7.6ポイント改善された。
論文 参考訳(メタデータ) (2025-10-24T02:59:55Z) - S$^{2}$-DMs:Skip-Step Diffusion Models [10.269647566864247]
拡散モデルは強力な生成ツールとして出現し、サンプル品質のGANと競合し、自己回帰モデルの可能性スコアを反映している。
これらのモデルのサブセットはDDIMによって例示され、固有の非対称性を示す:それらは$T$ステップで訓練されるが、生成時に$T$のサブセットからのみサンプルされる。
この選択的なサンプリング手法は、スピードに最適化されているが、無サンプルのステップから必然的に重要な情報を見逃し、サンプルの品質が損なわれる可能性がある。
革新的な$Lを用いた新しいトレーニング手法であるS$2$-DMを提案する。
論文 参考訳(メタデータ) (2024-01-03T03:08:32Z) - Grad-PU: Arbitrary-Scale Point Cloud Upsampling via Gradient Descent
with Learned Distance Functions [77.32043242988738]
我々は、任意のアップサンプリングレートをサポートする、正確なポイントクラウドアップサンプリングのための新しいフレームワークを提案する。
提案手法は,まず,所定のアップサンプリング率に応じて低解像度の雲を補間する。
論文 参考訳(メタデータ) (2023-04-24T06:36:35Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - Geometrical Homogeneous Clustering for Image Data Reduction [2.290085549352983]
そこで本研究では,データセットサイズを削減するため,同種クラスタリングアルゴリズムという従来手法の新たなバリエーションを提案する。
我々は、MNIST、CIFAR10、Fashion-MNISTの3つのデータセットで4つの変種を実験した。
GHCIDRの精度は99.35%、81.10%、91.66%で、トレーニングデータの減少率は87.27%、32.34%、76.80%であった。
論文 参考訳(メタデータ) (2022-08-27T19:42:46Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - Robust Segmentation Models using an Uncertainty Slice Sampling Based
Annotation Workflow [5.051373749267151]
本稿では,3次元医療ボリュームのセマンティックセグメンテーションのための不確実スライスサンプリング(USS)戦略を提案する。
多地点データを用いた肝セグメンテーション作業におけるUSSの有効性を示す。
論文 参考訳(メタデータ) (2021-09-30T06:56:11Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - Carath\'eodory Sampling for Stochastic Gradient Descent [79.55586575988292]
本稿では,Tchakaloff と Carath'eodory の古典的な結果から着想を得た手法を提案する。
我々は、測定値の低減を行う降下ステップを適応的に選択する。
これをBlock Coordinate Descentと組み合わせることで、測定の削減を極めて安価に行えるようにします。
論文 参考訳(メタデータ) (2020-06-02T17:52:59Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。