論文の概要: Domain-Guided YOLO26 with Composite BCE-Dice-Lovász Loss for Multi-Class Fetal Head Ultrasound Segmentation
- arxiv url: http://arxiv.org/abs/2603.26755v2
- Date: Tue, 31 Mar 2026 02:43:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.334802
- Title: Domain-Guided YOLO26 with Composite BCE-Dice-Lovász Loss for Multi-Class Fetal Head Ultrasound Segmentation
- Title(参考訳): 複合型BCE-Dice-Lovász損失を用いたマルチクラス胎児頭部超音波分割用ドメインガイドYOLO26
- Authors: M. Fazri Nizar,
- Abstract要約: 我々は、YOLO26-Segの上にプロンプトフリーパイプラインを構築し、脳、Cavum Septi Pellucidi(CSP)、横室(LV)の3つの構造を共同で検出し、セグメント化する。
i) 逆周波数クラス重み付けによる複合BCE-Dice-Lovszセグメンテーション損失を、実行時サルパッチングによるYOLO26トレーニングループに注入すること、(ii) 脳境界に対する解剖学的位置を尊重しながら、少数クラス構造を移植するドメイン誘導コピーペースト増強をすること、(iii) 患者間階層化。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Segmenting fetal head structures from prenatal ultrasound remains a practical bottleneck in obstetric imaging. The current state-of-the-art baseline, proposed alongside the published dataset, adapts the Segment Anything Model with per-class Dice and Lovász losses but still depends on bounding-box prompts at test time. We build a prompt-free pipeline on top of YOLO26-Seg that jointly detects and segments three structures, Brain, Cavum Septi Pellucidi (CSP), and Lateral Ventricles (LV), in a single forward pass. Three modifications are central to our approach: (i) a composite BCE-Dice-Lovász segmentation loss with inverse-frequency class weighting, injected into the YOLO26 training loop via runtime monkey-patching; (ii) domain-guided copy-paste augmentation that transplants minority-class structures while respecting their anatomical location relative to the brain boundary; and (iii) inter-patient stratified splitting to prevent data leakage. On 575 held-out test images, the composite loss variant reaches a mean Dice coefficient of 0.9253, exceeding the baseline (0.9012) by 2.68 percentage points, despite reporting over three foreground classes only, whereas the baseline's reported mean includes the easy background class. We further ablate each component and discuss annotation-quality and class-imbalance effects on CSP and LV performance.
- Abstract(参考訳): 出生前超音波から胎児頭部構造を分離することは, 産科的画像診断の実際的ボトルネックである。
現在の最先端のベースラインは、公開されたデータセットと共に提案されており、Segment Anything ModelをクラスごとのDiceとLovászの損失に適応しているが、テスト時のバウンディングボックスプロンプトに依存している。
YOLO26-Seg上にプロンプトフリーパイプラインを構築し,脳,Cavum Septi Pellucidi(CSP),および横室(LV)の3つの構造を1つの前方パスで共同で検出し,セグメント化する。
3つの修正が私たちのアプローチの中心です。
i) 逆周波数クラス重み付けによる複合BCE-Dice-Lovászセグメンテーション損失を、実行時サルパッチによるYOLO26トレーニングループに注入すること。
(二)脳の境界に対する解剖学的位置を尊重しながら少数民族構造を移植するドメイン誘導コピーペースト増強
三 データ漏洩を防止するため、患者間の階層分割。
575個のホールドアウトテスト画像では、ベースライン(0.9012)を2.68ポイント上回る平均Dice係数が0.9253に達するが、3つの前景クラスのみを報告し、ベースラインの報告された平均値に背景クラスが含まれる。
さらに、各コンポーネントをアブレーションし、CSPおよびLV性能に対するアノテーション品質とクラス不均衡の影響について論じる。
関連論文リスト
- Clinically-aligned ischemic stroke segmentation and ASPECTS scoring on NCCT imaging using a slice-gated loss on foundation representations [3.186130813218338]
ほとんどのディープラーニング手法は、ASPECTSスコアの基盤となる構造的解剖学的推論をモデル化することなく、ピクセルワイズセグメンテーションを行う。
本稿では,凍結したDINOv3バックボーンと軽量デコーダを組み合わせた臨床的に整合したフレームワークを提案する。
提案手法は,AISDにおけるDiceスコア0.6385を達成し,CNNや基礎モデルベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-02-27T12:12:24Z) - A topology-preserving three-stage framework for fully-connected coronary artery extraction [39.47027832777158]
冠動脈摘出術は,冠動脈疾患のコンピュータ診断に必須である。
完全連結冠状動脈抽出のためのトポロジー保存型3段階フレームワークを提案する。
このフレームワークには、血管のセグメンテーション、中心線再接続、血管再建の欠如が含まれる。
論文 参考訳(メタデータ) (2025-04-02T11:04:44Z) - Centerline Boundary Dice Loss for Vascular Segmentation [6.988368827452061]
画像診断における血管セグメンテーションは形態学的および機能的評価を分析する上で重要な役割を担っている。
中央のDice(clDice)損失のような伝統的な手法は、トポロジーの保存を確実にするが、幾何学的詳細を捉えることには失敗する。
位相整合性と幾何ニュアンスを調和させる中心線境界Dice(cbDice)損失関数を導入する。
論文 参考訳(メタデータ) (2024-07-01T17:58:44Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - PCCT: Progressive Class-Center Triplet Loss for Imbalanced Medical Image
Classification [55.703445291264]
不均衡トレーニングデータは、医用画像分類において重要な課題である。
クラス不均衡問題を軽減するために,PCCT(Progressive Class-Center Triplet)フレームワークを提案する。
PCCTフレームワークは、不均衡な訓練画像を用いた医用画像分類に効果的に機能する。
論文 参考訳(メタデータ) (2022-07-11T11:43:51Z) - Parallel Network with Channel Attention and Post-Processing for Carotid
Arteries Vulnerable Plaque Segmentation in Ultrasound Images [15.001128693323206]
本稿では,頸動脈超音波画像におけるプラークセグメンテーションのための自動畳み込みニューラルネットワーク(CNN)手法を提案する。
試験結果から, 30種類のプラークに対して, ディス値0.820, IoU 0.701, Acc 0.969, Hausdorff 距離 1.43 の修正Hausdorff 距離 (MHD) が得られた。
論文 参考訳(メタデータ) (2022-04-18T01:55:11Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Segmentation of the Myocardium on Late-Gadolinium Enhanced MRI based on
2.5 D Residual Squeeze and Excitation Deep Learning Model [55.09533240649176]
本研究の目的は,LGE-MRIを用いた心筋境界領域の深部学習モデルに基づく正確な自動セグメンテーション法を開発することである。
合計320回の試験(平均6回の試験)と28回の試験が行われた。
ベーススライスとミドルスライスにおけるアンサンブルモデルの性能解析は, サーバ内調査と同等であり, アトピーススライスではわずかに低かった。
論文 参考訳(メタデータ) (2020-05-27T20:44:38Z) - Hybrid Attention for Automatic Segmentation of Whole Fetal Head in
Prenatal Ultrasound Volumes [52.53375964591765]
胎児の頭部全体を米国全巻に分割する,最初の完全自動化ソリューションを提案する。
セグメント化タスクは、まずエンコーダ-デコーダディープアーキテクチャの下で、エンドツーエンドのボリュームマッピングとして定式化される。
次に,セグメンタとハイブリットアテンションスキーム(HAS)を組み合わせることで,識別的特徴を選択し,非情報量的特徴を抑える。
論文 参考訳(メタデータ) (2020-04-28T14:43:05Z) - clDice -- A Novel Topology-Preserving Loss Function for Tubular
Structure Segmentation [57.20783326661043]
中心線Dice (short clDice) と呼ばれる新しい類似度尺度を導入する。
理論的には、clDiceは2次元および3次元のセグメンテーションにおけるホモトピー同値までのトポロジー保存を保証する。
我々は、船舶、道路、ニューロン(2Dと3D)を含む5つの公開データセットでソフトクライス損失をベンチマークした。
論文 参考訳(メタデータ) (2020-03-16T16:27:49Z) - AttentionAnatomy: A unified framework for whole-body organs at risk
segmentation using multiple partially annotated datasets [30.23917416966188]
CT(Computed tomography)におけるOAR(Organs-at-risk)記述は,放射線治療(RT)計画において重要なステップである。
提案したエンドツーエンドの畳み込みニューラルネットワークモデルである textbfAttentionAnatomy は、3つの部分注釈付きデータセットで共同でトレーニングできる。
提案手法の実験結果から, ソレンセン・ディース係数 (DSC) と95%ハウスドルフ距離の両面で有意な改善が得られた。
論文 参考訳(メタデータ) (2020-01-13T18:31:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。