論文の概要: Towards Robust In-Context Learning for Medical Image Segmentation via Data Synthesis
- arxiv url: http://arxiv.org/abs/2509.19711v1
- Date: Wed, 24 Sep 2025 02:44:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.671876
- Title: Towards Robust In-Context Learning for Medical Image Segmentation via Data Synthesis
- Title(参考訳): データ合成による医用画像セグメンテーションのためのロバストなインコンテキスト学習に向けて
- Authors: Jiesi Hu, Yanwu Yang, Zhiyu Ye, Chenfei Ye, Hanyang Peng, Jianfeng Cao, Ting Ma,
- Abstract要約: ユニバーサルな医用画像セグメンテーションのためのIn-Context Learning (ICL)は、大規模で多様な訓練用データセットに対する前例のない需要をもたらした。
ドメインランダム化に基づく新しいデータ合成フレームワークである textbf SynthICL を提案する。
私たちの仕事は、ICLベースのセグメンテーションにおけるデータのボトルネックを軽減するのに役立ちます。
- 参考スコア(独自算出の注目度): 12.827413884809644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rise of In-Context Learning (ICL) for universal medical image segmentation has introduced an unprecedented demand for large-scale, diverse datasets for training, exacerbating the long-standing problem of data scarcity. While data synthesis offers a promising solution, existing methods often fail to simultaneously achieve both high data diversity and a domain distribution suitable for medical data. To bridge this gap, we propose \textbf{SynthICL}, a novel data synthesis framework built upon domain randomization. SynthICL ensures realism by leveraging anatomical priors from real-world datasets, generates diverse anatomical structures to cover a broad data distribution, and explicitly models inter-subject variations to create data cohorts suitable for ICL. Extensive experiments on four held-out datasets validate our framework's effectiveness, showing that models trained with our data achieve performance gains of up to 63\% in average Dice and substantially enhanced generalization to unseen anatomical domains. Our work helps mitigate the data bottleneck for ICL-based segmentation, paving the way for robust models. Our code and the generated dataset are publicly available at https://github.com/jiesihu/Neuroverse3D.
- Abstract(参考訳): 普遍的な医用画像セグメンテーションのためのインコンテキストラーニング(ICL)の台頭は、トレーニングのための大規模で多様なデータセットに対する前例のない需要をもたらし、データの不足という長年の問題を悪化させた。
データ合成は有望なソリューションを提供するが、既存の手法は高いデータの多様性と医療データに適した領域分布の両方を同時に達成できないことが多い。
このギャップを埋めるために,ドメインランダム化に基づく新しいデータ合成フレームワークであるtextbf{SynthICL}を提案する。
SynthICLは、現実世界のデータセットから解剖学的な先行データを活用することによってリアリズムを保証し、幅広いデータ分布をカバーする多様な解剖学的構造を生成し、ICLに適したデータコホートを生成するために、オブジェクト間のバリエーションを明示的にモデル化する。
4つのホールドアウトデータセットの大規模な実験により、我々のデータでトレーニングされたモデルが平均Diceで最大63%の性能向上を実現し、解剖学的領域に大きく拡張されたことが示され、我々のフレームワークの有効性が検証された。
我々の仕事は、ICLベースのセグメンテーションにおけるデータのボトルネックを軽減するのに役立ち、堅牢なモデルへの道を開く。
私たちのコードと生成されたデータセットはhttps://github.com/jiesihu/Neuroverse3D.comで公開されています。
関連論文リスト
- Is Exchangeability better than I.I.D to handle Data Distribution Shifts while Pooling Data for Data-scarce Medical image segmentation? [12.292774988144949]
データ不足は、特にディープラーニングモデルにおいて、医療画像における大きな課題である。
深層ネットワークのすべての層にまたがる前景特徴差を制御できる手法を提案する。
本手法は,5つのデータセットにまたがる病理組織像と超音波画像における最先端のセグメンテーション性能を実現する。
論文 参考訳(メタデータ) (2025-07-25T17:55:06Z) - Toward Generalizable Multiple Sclerosis Lesion Segmentation Models [0.0]
本研究の目的は,多様な評価データセットにまたがる一般化モデルを開発することである。
私たちは、最先端のUNet++アーキテクチャを体系的にトレーニングした、高品質で公開可能なすべてのMS病変セグメンテーションデータセットを使用しました。
論文 参考訳(メタデータ) (2024-10-25T15:21:54Z) - Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5091334993691206]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。
より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。
さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文 参考訳(メタデータ) (2024-09-17T17:22:35Z) - Generative Expansion of Small Datasets: An Expansive Graph Approach [13.053285552524052]
最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文 参考訳(メタデータ) (2024-06-25T02:59:02Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Quality Not Quantity: On the Interaction between Dataset Design and
Robustness of CLIP [43.7219097444333]
ここでは,CLIPにおける事前学習分布がロバスト性をいかに引き起こすかを調べるために,公開されている6つのデータソースのテストベッドを紹介する。
その結果,事前学習データの性能は分布変化によって大きく異なることがわかった。
複数のソースを組み合わせることで、必ずしもより良いモデルが得られるのではなく、最高の個々のデータソースのロバスト性を希薄にする。
論文 参考訳(メタデータ) (2022-08-10T18:24:23Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。