論文の概要: Rethinking Pulmonary Embolism Segmentation: A Study of Current Approaches and Challenges with an Open Weight Model
- arxiv url: http://arxiv.org/abs/2509.18308v2
- Date: Wed, 24 Sep 2025 01:07:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 11:55:19.841319
- Title: Rethinking Pulmonary Embolism Segmentation: A Study of Current Approaches and Challenges with an Open Weight Model
- Title(参考訳): 肺塞栓症再考 : オープンウェイトモデルによるアプローチと課題
- Authors: Yixin Zhang, Ryan Chamberlain, Lawrence Ngo, Kevin Kramer, Maciej A. Mazurowski,
- Abstract要約: 3Dモデルは、塞栓の形態的特徴から、この課題に特に適している。
CNNベースのモデルは一般的に、PEセグメンテーションにおけるVTベースのモデルよりも優れたパフォーマンスが得られる。
一方、タスクの複雑さと高品質なデータセットの不足のため、遠位塞栓は難しいままである。
- 参考スコア(独自算出の注目度): 21.024556007374684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we curated a densely annotated in-house dataset comprising 490 CTPA scans. Using this dataset, we systematically evaluated nine widely used segmentation architectures from both the CNN and Vision Transformer (ViT) families, initialized with either pretrained or random weights, under a unified testing framework as a performance audit. Our study leads to several important observations: (1) 3D U-Net with a ResNet encoder remains a highly effective architecture for PE segmentation; (2) 3D models are particularly well-suited to this task given the morphological characteristics of emboli; (3) CNN-based models generally yield superior performance compared to their ViT-based counterparts in PE segmentation; (4) classification-based pretraining, even on large PE datasets, can adversely impact segmentation performance compared to training from scratch, suggesting that PE classification and segmentation may rely on different sets of discriminative features; (5) different model architectures show a highly consistent pattern of segmentation performance when trained on the same data; and (6) while central and large emboli can be segmented with satisfactory accuracy, distal emboli remain challenging due to both task complexity and the scarcity of high-quality datasets. Besides these findings, our best-performing model achieves a mean Dice score of 0.7131 for segmentation. It detects 181 emboli with 49 false positives and 28 false negatives from 60 in-house testing scans. Its generalizability is further validated on public datasets.
- Abstract(参考訳): そこで本研究では,490個のCTPAスキャンを収録した高密度アノテートインハウスデータセットをキュレートした。
このデータセットを用いて,CNNおよびViT(Vision Transformer)ファミリーから広く利用されている9つのセグメンテーションアーキテクチャを,事前トレーニングおよびランダムな重み付けで初期化した。
本研究は,(1) ResNetエンコーダを用いた3次元U-Netは,PEセグメンテーションの高効率なアーキテクチャであり,(2)3次元モデルは,その形態的特徴から,特にこのタスクに適している。(3)CNNベースのモデルでは,PEセグメンテーションにおけるVTベースのモデルに比べて,一般的に優れた性能が得られている。(4)大きなPEデータセットであっても,スクラッチからのトレーニングよりもセグメンテーション性能に悪影響を及ぼす可能性がある。
これらの結果に加えて, セグメンテーションにおける Dice の平均スコアは 0.7131 である。
60個の検査スキャンから49個の偽陽性と28個の偽陰性で181個の塞栓を検出。
その一般化性は、パブリックデータセットでさらに検証される。
関連論文リスト
- The role of data partitioning on the performance of EEG-based deep learning models in supervised cross-subject analysis: a preliminary study [37.69303106863453]
ディープラーニングは、非常に非線形なパターンを効果的に発見することによって、脳波(EEG)データの解析を進めています。
ドメイン内に適切なデータパーティショニングとクロスバリデーションのための包括的なガイドラインは存在しない。
本稿では,脳波深層学習モデルの評価におけるデータ分割とクロスバリデーションの役割について,徹底的に検討する。
論文 参考訳(メタデータ) (2025-05-19T12:05:28Z) - A Comparative Performance Analysis of Classification and Segmentation Models on Bangladeshi Pothole Dataset [0.953693516244499]
この研究は、バングラデシュのポットホールデータセットに適用される一般的な分類とセグメンテーションモデルの総合的なパフォーマンス分析を含む。
ダッカとボグラの街路から収集された824のサンプルからなるこのカスタムデータセットは、既存の工業用およびカスタム用データセットと競合する。
実験の結果,我々のデータセットは,既存の文献で使用されている類似の分類モデルに匹敵する性能を示し,99%以上の精度とf1スコアを達成できた。
論文 参考訳(メタデータ) (2025-01-11T18:03:46Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - A Lightweight Measure of Classification Difficulty from Application Dataset Characteristics [4.220363193932374]
効率的なコサイン類似度に基づく分類困難度尺度Sを提案する。
データセットのクラス数とクラス内およびクラス間の類似度メトリクスから計算される。
この手法を実践者が、繰り返しトレーニングやテストによって、6倍から29倍の速度で効率の良いモデルを選択するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2024-04-09T03:27:09Z) - PULASki: Learning inter-rater variability using statistical distances to improve probabilistic segmentation [35.34932609930401]
本研究は,バイオメディカルイメージセグメンテーションのための計算効率の良い生成ツールとしてのPULASki法を提案する。
専門家のアノテーションでは、小さなデータセットであっても、変数をキャプチャする。
また,3次元パッチと従来の2次元スライスを用いた複雑なジオメトリーの計算可能セグメンテーションについて比較検討した。
論文 参考訳(メタデータ) (2023-12-25T10:31:22Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Robustness Analysis on Foundational Segmentation Models [28.01242494123917]
本研究では,セグメンテーションタスクのためのVisual Foundation Models (VFM) のロバストネス解析を行う。
2つの異なるデータセットを使用して、7つの最先端セグメンテーションアーキテクチャをベンチマークする。
VFMは、強靭性において不定形モデルをすべて上回るものではないにもかかわらず、圧縮誘起汚損に対する脆弱性を示し、マルチモーダルモデルはゼロショットシナリオにおける競争力を示し、VFMは特定の対象カテゴリに対して強靭性を示す。
論文 参考訳(メタデータ) (2023-06-15T16:59:42Z) - Part-Based Models Improve Adversarial Robustness [57.699029966800644]
人間の事前知識とエンドツーエンドの学習を組み合わせることで、ディープニューラルネットワークの堅牢性を向上させることができることを示す。
我々のモデルは、部分分割モデルと小さな分類器を組み合わせて、オブジェクトを同時に部品に分割するようにエンドツーエンドに訓練されている。
実験の結果,これらのモデルによりテクスチャバイアスが低減され,一般的な汚職に対する堅牢性が向上し,相関が急上昇することが示唆された。
論文 参考訳(メタデータ) (2022-09-15T15:41:47Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。