論文の概要: Data Efficiency and Transfer Robustness in Biomedical Image Segmentation: A Study of Redundancy and Forgetting with Cellpose
- arxiv url: http://arxiv.org/abs/2511.04803v1
- Date: Thu, 06 Nov 2025 20:45:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.585314
- Title: Data Efficiency and Transfer Robustness in Biomedical Image Segmentation: A Study of Redundancy and Forgetting with Cellpose
- Title(参考訳): バイオメディカルイメージセグメンテーションにおけるデータ効率と移動ロバスト性:細胞を用いた冗長性と形成に関する研究
- Authors: Shuo Zhao, Jianxu Chen,
- Abstract要約: Cellposeのような一般的なバイオメディカルイメージセグメンテーションモデルは、様々な画像モダリティや細胞タイプにまたがって適用されてきている。
本研究では,Cellposeをケーススタディとして,課題の体系的実証分析を行う。
データ冗長性を評価するため、コンパクトで多様なトレーニングサブセットを構築するための単純なデータセット量子化(DQ)戦略を提案する。
破滅的な忘れ物を調べるため、クロスドメイン微調整実験を行い、ソースドメインの性能の著しい劣化を観察する。
- 参考スコア(独自算出の注目度): 2.37771211295026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalist biomedical image segmentation models such as Cellpose are increasingly applied across diverse imaging modalities and cell types. However, two critical challenges remain underexplored: (1) the extent of training data redundancy and (2) the impact of cross domain transfer on model retention. In this study, we conduct a systematic empirical analysis of these challenges using Cellpose as a case study. First, to assess data redundancy, we propose a simple dataset quantization (DQ) strategy for constructing compact yet diverse training subsets. Experiments on the Cyto dataset show that image segmentation performance saturates with only 10% of the data, revealing substantial redundancy and potential for training with minimal annotations. Latent space analysis using MAE embeddings and t-SNE confirms that DQ selected patches capture greater feature diversity than random sampling. Second, to examine catastrophic forgetting, we perform cross domain finetuning experiments and observe significant degradation in source domain performance, particularly when adapting from generalist to specialist domains. We demonstrate that selective DQ based replay reintroducing just 5-10% of the source data effectively restores source performance, while full replay can hinder target adaptation. Additionally, we find that training domain sequencing improves generalization and reduces forgetting in multi stage transfer. Our findings highlight the importance of data centric design in biomedical image segmentation and suggest that efficient training requires not only compact subsets but also retention aware learning strategies and informed domain ordering. The code is available at https://github.com/MMV-Lab/biomedseg-efficiency.
- Abstract(参考訳): Cellposeのような一般的なバイオメディカルイメージセグメンテーションモデルは、様々な画像モダリティや細胞タイプにまたがって適用されてきている。
しかし,(1)トレーニングデータの冗長性の程度,(2)モデル保持に対するクロスドメイン転送の影響という2つの重要な課題がまだ探索されていない。
本研究では,Cellposeをケーススタディとして,これらの課題の体系的実証分析を行う。
まず、データ冗長性を評価するために、コンパクトで多様なトレーニングサブセットを構築するための単純なデータセット量子化(DQ)戦略を提案する。
Cytoデータセットの実験では、画像セグメンテーションのパフォーマンスはデータの10%で飽和しており、かなりの冗長性と最小限のアノテーションによるトレーニングの可能性を明らかにしている。
MAE埋め込みとt-SNEを用いた潜時空間解析により、DQ選択パッチがランダムサンプリングよりも大きな特徴多様性を捉えていることを確認した。
第2に、破滅的な忘れ物を調べるために、クロスドメイン微調整実験を行い、特にジェネラリストからスペシャリストドメインへの適応において、ソースドメインの性能の著しい劣化を観察する。
ソースデータの5~10%しか再生しない選択的なDQベースのリプレイは、ソース性能を効果的に回復する一方で、フルリプレイはターゲット適応を阻害することを示した。
さらに、トレーニングドメインシークエンシングにより一般化が向上し、マルチステージ転送における忘れの低減が図られる。
バイオメディカルイメージセグメンテーションにおけるデータ中心設計の重要性を強調し, 効率的なトレーニングには, コンパクトなサブセットだけでなく, 学習戦略や情報ドメインの順序付けも必要であることを示唆した。
コードはhttps://github.com/MMV-Lab/biomedseg-efficiency.comで公開されている。
関連論文リスト
- Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction [48.30341580103962]
本稿では、これらの問題に対処するために、新しい再視覚的二重ドメイン自己教師型深層展開ネットワークを提案する。
エンド・ツー・エンドの再構築を実現するために,シャンブルとポック・プロキシ・ポイント・アルゴリズム(DUN-CP-PPA)に基づく深層展開ネットワークを設計する。
高速MRIおよびIXIデータセットを用いて行った実験により,本手法は再建性能において最先端の手法よりも有意に優れていることが示された。
論文 参考訳(メタデータ) (2025-01-07T12:29:32Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Curriculum-Based Augmented Fourier Domain Adaptation for Robust Medical
Image Segmentation [18.830738606514736]
本研究は、堅牢な医用画像分割のためのカリキュラムベースの拡張フーリエドメイン適応(Curri-AFDA)を提案する。
特に、カリキュラム学習戦略は、異なるレベルのデータシフトの下でのモデルの因果関係に基づいている。
複数のサイトやスキャナーから収集した網膜と核の2つのセグメンテーションタスクの実験から,提案手法が優れた適応と一般化性能をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-06-06T08:56:58Z) - Frequency Disentangled Learning for Segmentation of Midbrain Structures
from Quantitative Susceptibility Mapping Data [1.9150304734969674]
深層モデルでは、ターゲット関数を低周波数から高周波数に適合させる傾向がある。
ディープセグメンテーションモデルのトレーニングに十分なサンプルがない場合が多い。
周波数領域の絡み合いに基づく新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-02-25T04:30:11Z) - Deep learning based domain adaptation for mitochondria segmentation on
EM volumes [5.682594415267948]
対象領域におけるミトコンドリアセグメンテーションを改善するための3つの非教師なし領域適応戦略を提案する。
そこで本研究では,ソースドメイン内でのみ得られる形態的事前条件に基づいて,新たな学習停止基準を提案する。
評価ラベルがない場合、提案した形態素に基づく計量をモニタリングすることは、トレーニングプロセスを止めて平均最適モデルを選択するための直感的で効果的な方法である。
論文 参考訳(メタデータ) (2022-02-22T09:49:25Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Cross-Domain Segmentation with Adversarial Loss and Covariate Shift for
Biomedical Imaging [2.1204495827342438]
本論文は,異なるモダリティから異なるパターンと共有パターンをカプセル化することにより,ドメイン間データから堅牢な表現を学習できる新しいモデルの実現を目的とする。
正常な臨床試験で得られたCTおよびMRI肝データに対する試験は、提案したモデルが他のすべてのベースラインを大きなマージンで上回っていることを示している。
論文 参考訳(メタデータ) (2020-06-08T07:35:55Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。