論文の概要: Staged Voxel-Level Deep Reinforcement Learning for 3D Medical Image Segmentation with Noisy Annotations
- arxiv url: http://arxiv.org/abs/2601.03875v1
- Date: Wed, 07 Jan 2026 12:39:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.508876
- Title: Staged Voxel-Level Deep Reinforcement Learning for 3D Medical Image Segmentation with Noisy Annotations
- Title(参考訳): 雑音アノテーションを用いた3次元医用画像分割のための段階的ボクセルレベル深部強化学習
- Authors: Yuyang Fu, Xiuzhen Guo, Ji Shi,
- Abstract要約: 本稿では,ノイズの多いアノテーションの下での堅牢な医用画像分割のためのエンドツーエンドのVoxel-Level Deep Reinforcement Learningフレームワークを提案する。
このフレームワークは動的反復的な更新戦略を使用して,手作業による介入を必要とせずに,誤ったラベルの影響を自動的に緩和する。
- 参考スコア(独自算出の注目度): 4.581671524490035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has achieved significant advancements in medical image segmentation. Currently, obtaining accurate segmentation outcomes is critically reliant on large-scale datasets with high-quality annotations. However, noisy annotations are frequently encountered owing to the complex morphological structures of organs in medical images and variations among different annotators, which can substantially limit the efficacy of segmentation models. Motivated by the fact that medical imaging annotator can correct labeling errors during segmentation based on prior knowledge, we propose an end-to-end Staged Voxel-Level Deep Reinforcement Learning (SVL-DRL) framework for robust medical image segmentation under noisy annotations. This framework employs a dynamic iterative update strategy to automatically mitigate the impact of erroneous labels without requiring manual intervention. The key advancements of SVL-DRL over existing works include: i) formulating noisy annotations as a voxel-dependent problem and addressing it through a novel staged reinforcement learning framework which guarantees robust model convergence; ii) incorporating a voxel-level asynchronous advantage actor-critic (vA3C) module that conceptualizes each voxel as an autonomous agent, which allows each agent to dynamically refine its own state representation during training, thereby directly mitigating the influence of erroneous labels; iii) designing a novel action space for the agents, along with a composite reward function that strategically combines the Dice value and a spatial continuity metric to significantly boost segmentation accuracy while maintain semantic integrity. Experiments on three public medical image datasets demonstrates State-of-The-Art (SoTA) performance under various experimental settings, with an average improvement of over 3\% in both Dice and IoU scores.
- Abstract(参考訳): 深層学習は医用画像のセグメンテーションにおいて大きな進歩を遂げた。
現在、正確なセグメンテーション結果を得ることは、高品質なアノテーションを持つ大規模データセットに極めて依存している。
しかし、医療画像における臓器の複雑な形態構造と異なるアノテータ間の差異により、ノイズアノテーションが頻繁に発生するため、セグメンテーションモデルの有効性は著しく制限される。
医用画像アノテータは、事前知識に基づいて、セグメンテーション中のラベリングエラーを補正できるため、ノイズの多いアノテーションの下で、堅牢な医用画像セグメンテーションのためのエンドツーエンドのVoxel-Level Deep Reinforcement Learning(SVL-DRL)フレームワークを提案する。
このフレームワークは動的反復的な更新戦略を使用して,手作業による介入を必要とせずに,誤ったラベルの影響を自動的に緩和する。
既存の作品に対するSVL-DRLの重要な進歩は以下のとおりである。
一 ボクセルに依存した問題としてうるさいアノテーションを定式化し、かつ、堅牢なモデル収束を保証する新規な強化学習枠組みによりそれに取り組むこと。
二 個別のボクセルを自律的エージェントとして概念化するボクセルレベルの非同期アドバンスアクタークリティカル(vA3C)モジュールを組み込むことにより、訓練中に各エージェントが自身の状態表現を動的に洗練させ、これにより誤ラベルの影響を直接緩和することができる。
三 エージェントのための新規な行動空間を設計し、かつ、Dice値と空間連続度を戦略的に組み合わせて意味的整合性を維持しつつセグメンテーションの精度を大幅に向上させる複合報酬関数を設計すること。
3つの公開医療画像データセットの実験では、様々な実験環境下でのSoTA(State-of-The-Art)のパフォーマンスが示され、DiceとIoUのスコアでは平均3倍以上の改善が見られた。
関連論文リスト
- Enhancing Dual Network Based Semi-Supervised Medical Image Segmentation with Uncertainty-Guided Pseudo-Labeling [5.1962665598872135]
本稿では,デュアルネットワークアーキテクチャに基づく新しい半教師付き3次元医用画像分割フレームワークを提案する。
具体的には,クロス・擬似とエントロピーフィルタの両方を用いたクロス・コンシステンシー・エンハンスメント・モジュールについて検討し,ノイズの多い擬似ラベルを減らす。
さらに、教師付きコントラスト学習機構を用いて、不確実なボクセル特徴を信頼性の高いクラスプロトタイプと整合させる。
論文 参考訳(メタデータ) (2025-09-16T13:40:20Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - Unified Supervision For Vision-Language Modeling in 3D Computed Tomography [1.4193731654133002]
汎用視覚言語モデル(VLM)は放射線学において有望なツールとして登場し、ゼロショット機能を提供している。
診断放射線学のような高度な領域では、これらのモデルは信頼できる臨床使用に必要な識別精度を欠いていることが多い。
分類ラベルやセグメンテーションマスクにエンコードされた多種多様な監視信号を統合するボリュームVLMであるUniferumを,単一のトレーニングフレームワークに導入する。
論文 参考訳(メタデータ) (2025-09-01T15:30:17Z) - TABNet: A Triplet Augmentation Self-Recovery Framework with Boundary-Aware Pseudo-Labels for Medical Image Segmentation [4.034121387622003]
本稿では,医用画像分割フレームワークTAB Netを提案する。
三重化自己回復モジュール(TAS)と境界対応擬似ラベル監視モジュール(BAP)から構成されている。
我々は,TAB Netが,スクリブルベースの弱教師付きセグメンテーションにおいて,最先端の手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-07-03T07:50:00Z) - HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Enhancing Weakly Supervised 3D Medical Image Segmentation through Probabilistic-aware Learning [47.700298779672366]
3次元医用画像のセグメンテーションは、疾患の診断と治療計画に重要な意味を持つ課題である。
近年の深層学習の進歩は、完全に教師付き医療画像のセグメンテーションを著しく強化している。
本稿では,3次元医用画像に特化して設計された,確率的適応型弱教師付き学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-05T00:46:53Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.0920148653974255]
本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。
そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文 参考訳(メタデータ) (2023-11-01T12:33:04Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。