論文の概要: Open-radiomics: A Collection of Standardized Datasets and a Technical Protocol for Reproducible Radiomics Machine Learning Pipelines
- arxiv url: http://arxiv.org/abs/2207.14776v3
- Date: Fri, 28 Feb 2025 19:37:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-04 16:10:43.644196
- Title: Open-radiomics: A Collection of Standardized Datasets and a Technical Protocol for Reproducible Radiomics Machine Learning Pipelines
- Title(参考訳): Open-Radiomics: 標準化されたデータセットのコレクションと再生可能放射能機械学習パイプラインの技術プロトコル
- Authors: Khashayar Namdar, Matthias W. Wagner, Birgit B. Ertl-Wagner, Farzad Khalvati,
- Abstract要約: 我々は,3つのオープンソースデータセット,高次グリオーマ(HGG)と低次グリオーマ(LGG)の分類と生存分析のためのBraTS 2020に基づいて,大規模放射線学データセットをキュレートした。
脳腫瘍369例(GG76例,HG293例)に本プロトコルを適用した。
binWidthや画像正規化とは異なり,腫瘍の亜領域と画像の配列はモデルの性能に大きく影響した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Background: As an important branch of machine learning pipelines in medical imaging, radiomics faces two major challenges namely reproducibility and accessibility. In this work, we introduce open-radiomics, a set of radiomics datasets along with a comprehensive radiomics pipeline based on our proposed technical protocol to improve the reproducibility of the results. Methods: We curated large-scale radiomics datasets based on three open-source datasets; BraTS 2020 for high-grade glioma (HGG) versus low-grade glioma (LGG) classification and survival analysis, BraTS 2023 for O6-methylguanine-DNA methyltransferase classification, and non-small cell lung cancer survival analysis from the Cancer Imaging Archive. Using BraTS 2020 Magnetic Resonance Imaging (MRI) dataset, we applied our protocol to 369 brain tumor patients (76 LGG, 293 HGG). Leveraging PyRadiomics for LGG vs. HGG classification, we generated 288 datasets from 4 MRI sequences, 3 binWidths, 6 normalization methods, and 4 tumor subregions. Random Forest classifiers were trained and validated (60%,20%,20%) across 100 different data splits (28,800 test results), evaluating Area Under the Receiver Operating Characteristic Curve (AUROC). Results: Unlike binWidth and image normalization, tumor subregion and imaging sequence significantly affected performance of the models. T1 contrast-enhanced sequence and the union of Necrotic and the non-enhancing tumor core subregions resulted in the highest AUROCs (average test AUROC 0.951, 95% confidence interval of (0.949, 0.952)). Although several settings and data splits (28 out of 28800) yielded test AUROC of 1, they were irreproducible. Conclusion: Our experiments demonstrate the sources of variability in radiomics pipelines (e.g., tumor subregion) can have a significant impact on the results, which may lead to superficial perfect performances that are irreproducible.
- Abstract(参考訳): 背景: 医療画像における機械学習パイプラインの重要な分野として、放射能は再現性とアクセシビリティという2つの大きな課題に直面している。
本研究では,その再現性を向上させるため,提案した技術プロトコルに基づいて,一連の放射能データセットと包括的放射能パイプラインを導入する。
方法】高次グリオーマ (HGG) と低次グリオーマ (LGG) の分類と生存分析のためのBraTS 2020, O6-メチルグアニン-DNAメチルトランスフェラーゼの分類のためのBraTS 2023, がん画像アーカイブからの非小細胞肺癌生存解析の3つのデータセットに基づいて, 大規模放射線学データセットを収集した。
BraTS 2020 Magnetic Resonance Imaging (MRI) データセットを用いて369名の脳腫瘍患者 (76 LGG, 293 HGG) に適用した。
LGGとHGGの分類にPyRadiomicsを応用し、4つのMRIシークエンス、3つのbinWidths、6つの正規化法、4つの腫瘍サブリージョンから288個のデータセットを生成した。
ランダムフォレスト分類器は、100の異なるデータ分割(28,800の試験結果)で60%、20%、20%の訓練を受け、AUROC(Area Under the Receiver Operating Characteristics Curve)を評価した。
結果: binWidth法と画像正規化法と異なり, 腫瘍亜領域と画像系列はモデルの性能に大きく影響した。
T1コントラスト増強配列と壊死性腫瘍コアサブリージョンと非増強性腫瘍コアサブリージョンの結合はAUROC(平均値AUROC 0.951,95%信頼区間0.949,0.952)の最高値となった。
いくつかの設定とデータ分割(28800点中28点)は1のAUROCをテストした。
結論: 放射能パイプライン(例, 腫瘍亜領域)の変動源は, 結果に有意な影響を及ぼす可能性が示唆された。
関連論文リスト
- Brain Tumor Segmentation (BraTS) Challenge 2024: Meningioma Radiotherapy Planning Automated Segmentation [47.119513326344126]
BraTS-MEN-RTの課題は、脳MRIを計画する放射線治療の最大のマルチ機関データセットを使用して、自動セグメンテーションアルゴリズムを進化させることである。
それぞれの症例には、3D後T1強調放射線治療計画MRIがネイティブな取得スペースに含まれている。
ターゲットボリュームアノテーションは、確立された放射線治療計画プロトコルに準拠している。
論文 参考訳(メタデータ) (2024-05-28T17:25:43Z) - CXR-LLAVA: a multimodal large language model for interpreting chest
X-ray images [3.0757789554622597]
本研究の目的は,胸部X線画像(CXR)を解釈するためのオープンソースのマルチモーダル大言語モデル(CXR-LLAVA)を開発することである。
トレーニングでは,592,580個のCXRを収集し,そのうち374,881個のX線写真異常のラベルが得られた。
主な病理所見に対する診断成績と,ヒト放射線技師による放射線学的報告の受容性について検討した。
論文 参考訳(メタデータ) (2023-10-22T06:22:37Z) - Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。
MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-08-29T17:44:28Z) - Brain Tumor Recurrence vs. Radiation Necrosis Classification and Patient
Survivability Prediction [0.0]
GBMは成人で最もアグレッシブな脳腫瘍であり、手術や放射線治療による攻撃的治療でも生存率が低い。
放射線治療後のGBM患者のMRIの変化は、放射線誘発壊死(RN)または再発脳腫瘍(rBT)の指標である
本研究では, rBT と RN の分類におけるサブセット標本サイズのバランスをとるために, 統計的に厳密な繰り返しランダムサブサンプリングを用いた計算モデルを提案する。
論文 参考訳(メタデータ) (2023-06-05T21:39:11Z) - MRI-based classification of IDH mutation and 1p/19q codeletion status of
gliomas using a 2.5D hybrid multi-task convolutional neural network [0.18374319565577152]
グリオーマにおけるIsocitrate dehydrogenase変異と1p/19q符号欠失は重要な予後マーカーである。
我々の目標は、MRIからこれらの分子変化を非侵襲的に決定する人工知能ベースの手法を開発することであった。
2.5Dハイブリッド畳み込みニューラルネットワークは、腫瘍を同時に局在させ、その分子状態を分類するために提案された。
論文 参考訳(メタデータ) (2022-10-07T18:46:39Z) - Deep Learning for Classification of Thyroid Nodules on Ultrasound:
Validation on an Independent Dataset [7.4674725823899175]
本研究の目的は,新しい甲状腺超音波画像データセットに事前に検証された深層学習アルゴリズムを適用することである。
このアルゴリズムと放射線技師の相対的な性能差は、超音波スキャナーの違いによって大きく影響されない。
論文 参考訳(メタデータ) (2022-07-27T19:45:41Z) - StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact
Context-encoding Variational Autoencoder [48.2010192865749]
教師なし異常検出(UAD)は、健康な被験者の異常なデータセットからデータ分布を学習し、分布サンプルの抽出に応用することができる。
本研究では,コンテクストエンコーディング(context-encoding)VAE(ceVAE)モデルのコンパクトバージョンと,前処理と後処理のステップを組み合わせて,UADパイプライン(StRegA)を作成することを提案する。
提案したパイプラインは、BraTSデータセットのT2w画像と0.859$pm$0.112の腫瘍を検出しながら、Diceスコアが0.642$pm$0.101に達した。
論文 参考訳(メタデータ) (2022-01-31T14:27:35Z) - Event-based clinical findings extraction from radiology reports with
pre-trained language model [0.22940141855172028]
今回,臨床所見を付加した新しい放射線診断報告のコーパスを報告する。
金の標準コーパスには合計500点の注記CTレポートが含まれていた。
BERTを含む2つの最先端ディープラーニングアーキテクチャを用いて、トリガと引数のエンティティを抽出した。
論文 参考訳(メタデータ) (2021-12-27T05:03:10Z) - FLANNEL: Focal Loss Based Neural Network Ensemble for COVID-19 Detection [61.04937460198252]
正常, 細菌性肺炎, 非ウイルス性肺炎, COVID-19の4型を有する2874例のX線画像データを構築した。
FLANNEL(Focal Loss Based Neural Ensemble Network)を提案する。
FLANNELは、すべての指標において、新型コロナウイルス識別タスクのベースラインモデルを一貫して上回っている。
論文 参考訳(メタデータ) (2020-10-30T03:17:31Z) - A multicenter study on radiomic features from T$_2$-weighted images of a
customized MR pelvic phantom setting the basis for robust radiomic models in
clinics [47.187609203210705]
骨盤ファントムの2Dおよび3D T$$-weightedイメージを3つのスキャナーで取得した。
放射線学的特徴の再現性と再配置を評価した。
論文 参考訳(メタデータ) (2020-05-14T09:24:48Z) - Machine-Learning-Based Multiple Abnormality Prediction with Large-Scale
Chest Computed Tomography Volumes [64.21642241351857]
19,993症例から36,316巻の胸部CTデータセットを収集,解析した。
自由テキストラジオグラフィーレポートから異常ラベルを自動的に抽出するルールベース手法を開発した。
胸部CTボリュームの多臓器・多臓器分類モデルも開発した。
論文 参考訳(メタデータ) (2020-02-12T00:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。