論文の概要: Performance Deterioration of Deep Learning Models after Clinical
Deployment: A Case Study with Auto-segmentation for Definitive Prostate
Cancer Radiotherapy
- arxiv url: http://arxiv.org/abs/2210.05673v2
- Date: Thu, 16 Nov 2023 06:29:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-18 02:54:39.333780
- Title: Performance Deterioration of Deep Learning Models after Clinical
Deployment: A Case Study with Auto-segmentation for Definitive Prostate
Cancer Radiotherapy
- Title(参考訳): 臨床展開後のディープラーニングモデルの性能劣化 : 前立腺癌に対するオートセグメンテーションを応用した症例
- Authors: Biling Wang, Michael Dohopolski, Ti Bai, Junjie Wu, Raquibul Hannan,
Neil Desai, Aurelie Garant, Daniel Yang, Dan Nguyen, Mu-Han Lin, Robert
Timmerman, Xinlei Wang, Steve Jiang
- Abstract要約: 2006年から2011年までのデータに基づいてUNetベースのセグメンテーションモデルをトレーニングし、2012年から2022年までのデータでテストしました。
我々はDice similarity coefficient (DSC) を用いてモデル性能を測定し,指数重み付き移動平均 (EMA) 曲線を用いて輪郭品質の傾向を可視化した。
このモデルでは,前立腺,直腸,膀胱を分節する最初の段階(2012年から2014年まで)でピーク性能を示した。
- 参考スコア(独自算出の注目度): 6.078475107765455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We evaluated the temporal performance of a deep learning (DL) based
artificial intelligence (AI) model for auto segmentation in prostate
radiotherapy, seeking to correlate its efficacy with changes in clinical
landscapes. Our study involved 1328 prostate cancer patients who underwent
definitive radiotherapy from January 2006 to August 2022 at the University of
Texas Southwestern Medical Center. We trained a UNet based segmentation model
on data from 2006 to 2011 and tested it on data from 2012 to 2022 to simulate
real world clinical deployment. We measured the model performance using the
Dice similarity coefficient (DSC), visualized the trends in contour quality
using exponentially weighted moving average (EMA) curves. Additionally, we
performed Wilcoxon Rank Sum Test to analyze the differences in DSC
distributions across distinct periods, and multiple linear regression to
investigate the impact of various clinical factors. The model exhibited peak
performance in the initial phase (from 2012 to 2014) for segmenting the
prostate, rectum, and bladder. However, we observed a notable decline in
performance for the prostate and rectum after 2015, while bladder contour
quality remained stable. Key factors that impacted the prostate contour quality
included physician contouring styles, the use of various hydrogel spacer, CT
scan slice thickness, MRI-guided contouring, and using intravenous (IV)
contrast. Rectum contour quality was influenced by factors such as slice
thickness, physician contouring styles, and the use of various hydrogel
spacers. The bladder contour quality was primarily affected by using IV
contrast. This study highlights the challenges in maintaining AI model
performance consistency in a dynamic clinical setting. It underscores the need
for continuous monitoring and updating of AI models to ensure their ongoing
effectiveness and relevance in patient care.
- Abstract(参考訳): 前立腺放射線治療における深層学習(DL)に基づく人工知能(AI)モデルの時間的性能評価を行い,その効果と臨床像の変化との関連性を検討した。
2006年1月から2022年8月まで,テキサス大学サウスウェスタン医療センターにて放射線治療を受けた前立腺癌1328例について検討した。
我々は、2006年から2011年までのデータに基づいてUNetベースのセグメンテーションモデルをトレーニングし、2012年から2022年までのデータに基づいて実世界の臨床展開をシミュレートした。
我々はDice similarity coefficient (DSC) を用いてモデル性能を測定し,指数重み付き移動平均(EMA)曲線を用いて輪郭品質の傾向を可視化した。
また,各期間間のdsc分布の差異を解析するためにウィルコクソンランクサムテストを行い,各種臨床因子の影響について検討した。
このモデルでは,前立腺,直腸,膀胱を分節する最初の段階(2012年から2014年まで)でピーク性能を示した。
しかし,2015年以降,前立腺と直腸のパフォーマンスは著しく低下し,膀胱の輪郭品質は安定していた。
前立腺輪郭品質に影響を及ぼす主な要因は,医師のコントラスト,ハイドロゲルスペーサの使用,ctスキャンスライス厚,mriガイドドコントーリング,静脈内コントラストの使用であった。
構造輪郭の品質はスライス厚,医師のコンチューリングスタイル,各種ハイドロゲルスペーサーの使用などの影響を受けていた。
膀胱の輪郭品質はIVコントラストによる影響が大きかった。
この研究は、動的臨床環境でAIモデルのパフォーマンス一貫性を維持する上での課題を強調する。
aiモデルの継続的な監視とアップデートの必要性を強調し、患者ケアにおける継続的な効果と妥当性を保証する。
関連論文リスト
- Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Modeling Long Sequences in Bladder Cancer Recurrence: A Comparative Evaluation of LSTM,Transformer,and Mamba [0.0]
本研究では,Cox比例ハザードモデルを用いて,時系列データを扱う深層学習モデルの利点を統合する。
LSTM-Coxモデルは、TransformerやMambaといった新しいモデルにまたがる、リカレントなデータ解析と特徴抽出のための堅牢で効率的な方法である。
論文 参考訳(メタデータ) (2024-05-28T18:38:15Z) - Transformer-Based Self-Supervised Learning for Histopathological Classification of Ischemic Stroke Clot Origin [0.0]
虚血性脳卒中における血栓塞栓源の同定は治療と二次予防に不可欠である。
本研究は,虚血性脳梗塞の発生源を分類するためのエンボリのデジタル病理学における自己教師型深層学習アプローチについて述べる。
論文 参考訳(メタデータ) (2024-05-01T23:40:12Z) - Fairness Evolution in Continual Learning for Medical Imaging [47.52603262576663]
医用画像の分類性能に関する連続学習戦略(CL)の行動について検討した。
我々は,リプレイ,フォーッティングなし学習(LwF),LwF,Pseudo-Label戦略を評価した。
LwF と Pseudo-Label は最適な分類性能を示すが、評価に公正度の測定値を含めると、Pseudo-Label がバイアスが少ないことは明らかである。
論文 参考訳(メタデータ) (2024-04-10T09:48:52Z) - Multimodal deep learning approach to predicting neurological recovery
from coma after cardiac arrest [2.374912052693646]
本研究の目的は,臨床データと多チャンネル脳波,心電図などの時系列データを用いて,心停止後のコマから神経学的回復を予測することである。
提案したモデルでは,自然循環復帰後,72ドル(約7,200円)の予測を行うために,隠れテストセットで0.53ドル(約5,800円)のスコアを得た。
論文 参考訳(メタデータ) (2024-03-09T22:29:24Z) - Deep Learning for Predicting Progression of Patellofemoral
Osteoarthritis Based on Lateral Knee Radiographs, Demographic Data and
Symptomatic Assessments [1.1549572298362785]
本研究はMOST研究のベースラインから被験者(被験者1832名,膝3276名)を抽出した。
PF関節領域は, 側膝X線上の自動ランドマーク検出ツール(BoneFinder)を用いて同定した。
年齢、性別、BMIおよびWOMACスコア、および大腿骨関節X線学的関節炎ステージ(KLスコア)の危険因子について
論文 参考訳(メタデータ) (2023-05-10T06:43:33Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - TotalSegmentator: robust segmentation of 104 anatomical structures in CT
images [48.50994220135258]
身体CT画像の深層学習セグメント化モデルを提案する。
このモデルは、臓器の容積、疾患の特徴、外科的または放射線療法計画などのユースケースに関連する104の解剖学的構造を区分することができる。
論文 参考訳(メタデータ) (2022-08-11T15:16:40Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - StyPath: Style-Transfer Data Augmentation For Robust Histology Image
Classification [6.690876060631452]
我々は,StyPathに基づくAMR分類のための,堅牢なディープニューラルネットワークを構築するための新しいパイプラインを提案する。
それぞれの画像は、1GTX V TITANとpytorchを使って1.84 + 0.03秒で生成された。
以上の結果から,本手法は組織学的分類性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2020-07-09T18:02:49Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。