論文の概要: Disentangling Sampling from Training Budget in Class-Imbalanced CT Body Composition Segmentation
- arxiv url: http://arxiv.org/abs/2605.20405v1
- Date: Tue, 19 May 2026 19:01:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.335202
- Title: Disentangling Sampling from Training Budget in Class-Imbalanced CT Body Composition Segmentation
- Title(参考訳): クラス不均衡CT体組成セグメンテーションにおけるトレーニング予算からのアンタングリングサンプリング
- Authors: Iason Skylitsis, Dimitrios Karkalousos, Ivana Išgum,
- Abstract要約: 授業不均衡は医療画像のセグメンテーションにおける基本的な課題であり、稀な授業を犠牲にして、しばしば授業が訓練を支配している。
我々は、クラスバランスの取れたバッチ構築を教師付き環境で促進するために、数ショット学習からのエピソードサンプリングを採用する。
SAROSデータセットの210スキャンから得られた9つの筋肉および脂肪組織における無作為および重み付きサンプリングに対するエピソードサンプリングを比較した。
- 参考スコア(独自算出の注目度): 0.05319453183808007
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Class imbalance is a fundamental challenge in medical image segmentation, where frequent classes typically dominate training at the expense of rare classes. Loss-based approaches mitigate imbalance by reweighting the per-pixel loss within the batch, while sampling strategies control which images enter the batch. Yet neither explicitly controls which classes appear within the batch, leaving rare-class exposure only partially rebalanced. In this work, we adopt episodic sampling from few-shot learning to promote class-balanced batch construction in a fully supervised setting. We decouple episodic sampling from its conventional metric-learning context and evaluate it in body composition segmentation in CT. We compare episodic sampling against random and weighted sampling on nine muscle and adipose tissues, derived from 210 scans of the public SAROS dataset. Training is performed under full- and low-data regimes, with additional comparisons under matched training iteration budgets. Under full-data training, all three strategies performed comparably (mean Dice 0.882 for episodic, 0.878 for random and weighted). Under low-data training, episodic sampling outperformed random and weighted (0.787 vs. 0.758 and 0.762), driven by a 12-fold difference in training iterations. Under matched training budgets, random and weighted overfit earlier, while episodic improved for approximately three times more iterations before plateauing. Our findings identify the training iteration budget as under-recognized confound in sampling strategies, motivating iteration-aware evaluation protocols for small datasets. Furthermore, the residual advantage of episodic sampling is consistent with an implicit regularization effect of class-balanced batches, offering a low-cost, model-agnostic strategy for class-imbalanced medical image segmentation. Code is available at https://github.com/iasonsky/episodic-sampling.
- Abstract(参考訳): 授業不均衡は医療画像のセグメンテーションにおける基本的な課題であり、稀な授業を犠牲にして、しばしば授業が訓練を支配している。
ロスベースのアプローチは、バッチ内のピクセル単位の損失を再重み付けし、どのイメージがバッチに入るかのサンプリング戦略を制御することで、不均衡を軽減する。
しかし、どちらのクラスがバッチ内に表示されるかを明示的に制御することもできず、レアクラスの露出は部分的にリバランスするだけである。
本研究では,クラスバランスの取れたバッチ構築を完全教師付き環境で促進するために,少数ショット学習からのエピソードサンプリングを採用する。
我々は,従来のメトリクス学習コンテキストからエピソードサンプリングを分離し,CTにおける身体組成のセグメンテーションで評価する。
SAROSデータセットの210スキャンから得られた9つの筋肉および脂肪組織における無作為および重み付きサンプリングに対するエピソードサンプリングを比較した。
トレーニングは、フルデータとローデータで実施され、トレーニングイテレーションの予算にマッチした追加比較が行われる。
全データトレーニングでは、すべての3つの戦略が比較可能に実行された(エピソジックはDice 0.882、ランダムと重み付けは0.878)。
低データトレーニングでは、エピソードサンプリングはランダムに改善し(0.787対0.758と0.762)、トレーニングイテレーションの12倍の違いによって駆動された。
整合したトレーニング予算の下では、ランダムで重み付けされたオーバーフィットが早くなり、エピソードはプレート化前の約3倍のイテレーションで改善された。
本研究は, トレーニングイテレーション予算を, サンプリング戦略における未認識のコンファウンドとして認識し, 小型データセットに対する反復認識評価プロトコルを動機付けている。
さらに、エピソードサンプリングの残余の利点は、クラスバランスのバッチの暗黙的な正規化効果と一致し、クラスバランスの医療画像セグメンテーションのための低コストでモデルに依存しない戦略を提供する。
コードはhttps://github.com/iasonsky/episodic-sampling.comで入手できる。
関連論文リスト
- Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Balanced Data Sampling for Language Model Training with Clustering [96.46042695333655]
本稿では,学習データのテキスト分布のバランスをとるためにClusterClip Smplingを提案する。
大規模な実験は、ClusterClip Smplingの有効性を検証する。
論文 参考訳(メタデータ) (2024-02-22T13:20:53Z) - A Novel Hybrid Sampling Framework for Imbalanced Learning [0.0]
SMOTE-RUS-NC」は他の最先端サンプリング技術と比較されている。
26個の不均衡なデータセットで厳密な実験が行われた。
論文 参考訳(メタデータ) (2022-08-20T07:04:00Z) - Learning to Re-weight Examples with Optimal Transport for Imbalanced
Classification [74.62203971625173]
不均衡データは、ディープラーニングに基づく分類モデルに課題をもたらす。
不均衡なデータを扱うための最も広く使われているアプローチの1つは、再重み付けである。
本稿では,分布の観点からの最適輸送(OT)に基づく新しい再重み付け手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T01:23:54Z) - Breadcrumbs: Adversarial Class-Balanced Sampling for Long-tailed
Recognition [95.93760490301395]
クラスごとのサンプル数が非バランスである長尾認識の問題は、考慮されます。
これは例の繰り返しサンプリングによるものであり、特徴空間拡張によって対処できると仮定される。
トレーニング中のエポック間の機能のバックトラッキングに基づく,新たな機能拡張戦略であるemanateを提案する。
新たなサンプリング手順であるbreadcrumbは、余分な計算なしで逆のクラスバランスのサンプリングを実装するために導入された。
論文 参考訳(メタデータ) (2021-05-01T00:21:26Z) - Jo-SRC: A Contrastive Approach for Combating Noisy Labels [58.867237220886885]
Jo-SRC (Joint Sample Selection and Model Regularization based on Consistency) というノイズロバスト手法を提案する。
具体的には、対照的な学習方法でネットワークをトレーニングする。
各サンプルの2つの異なるビューからの予測は、クリーンまたは分布不足の「可能性」を推定するために使用されます。
論文 参考訳(メタデータ) (2021-03-24T07:26:07Z) - Bayesian Sampling Bias Correction: Training with the Right Loss Function [0.0]
我々は、サンプリングバイアスの存在下でモデルを訓練するために損失関数の族を導出する。
例えば、病理の頻度がトレーニングデータセットのサンプリングレートと異なる場合や、マシンラーニングの実践者がトレーニングデータセットを再バランスする場合などだ。
論文 参考訳(メタデータ) (2020-06-24T15:10:43Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。