論文の概要: Deep learning generates custom-made logistic regression models for
explaining how breast cancer subtypes are classified
- arxiv url: http://arxiv.org/abs/2001.06988v2
- Date: Tue, 19 Jul 2022 03:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 04:56:23.263461
- Title: Deep learning generates custom-made logistic regression models for
explaining how breast cancer subtypes are classified
- Title(参考訳): 深層学習は、乳がんサブタイプがどのように分類されるかを説明するカスタムメイドロジスティック回帰モデルを生成する
- Authors: Takuma Shibahara, Chisa Wada, Yasuho Yamashita, Kazuhiro Fujita,
Masamichi Sato, Junichi Kuwata, Atsushi Okamoto, and Yoshimasa Ono
- Abstract要約: 我々は,各患者に対してカスタムメイドのロジスティック回帰を生成するPWLモデルという説明可能なディープラーニングモデルを開発した。
我々は、RNA-seqデータを用いてPWLモデルを訓練し、PAM50固有のサブタイプを予測し、サブタイプ予測タスクを通じてPAM50の41/50遺伝子に適用した。
- 参考スコア(独自算出の注目度): 0.2529563359433233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Differentiating the intrinsic subtypes of breast cancer is crucial for
deciding the best treatment strategy. Deep learning can predict the subtypes
from genetic information more accurately than conventional statistical methods,
but to date, deep learning has not been directly utilized to examine which
genes are associated with which subtypes. To clarify the mechanisms embedded in
the intrinsic subtypes, we developed an explainable deep learning model called
a point-wise linear (PWL) model that generates a custom-made logistic
regression for each patient. Logistic regression, which is familiar to both
physicians and medical informatics researchers, allows us to analyze the
importance of the feature variables, and the PWL model harnesses these
practical abilities of logistic regression. In this study, we show that
analyzing breast cancer subtypes is clinically beneficial for patients and one
of the best ways to validate the capability of the PWL model. First, we trained
the PWL model with RNA-seq data to predict PAM50 intrinsic subtypes and applied
it to the 41/50 genes of PAM50 through the subtype prediction task. Second, we
developed a deep enrichment analysis method to reveal the relationships between
the PAM50 subtypes and the copy numbers of breast cancer. Our findings showed
that the PWL model utilized genes relevant to the cell cycle-related pathways.
These preliminary successes in breast cancer subtype analysis demonstrate the
potential of our analysis strategy to clarify the mechanisms underlying breast
cancer and improve overall clinical outcomes.
- Abstract(参考訳): 乳がんの内因性サブタイプを区別することは治療戦略を決定する上で重要である。
深層学習は、従来の統計的手法よりも正確な遺伝情報からサブタイプを予測することができるが、現在まで、どのサブタイプに関連づけられた遺伝子を直接研究するために深層学習は使われていない。
内在サブタイプに埋め込まれたメカニズムを明らかにするため,各患者にカスタムメイドロジスティック回帰を生成するPWLモデルという,説明可能な深層学習モデルを開発した。
ロジスティック回帰は, 医師と医療情報学研究者の両方に親しまれており, 特徴変数の重要性を解析することが可能であり, PWLモデルはこれらのロジスティック回帰の実践的能力を利用する。
本研究は, 乳癌の亜型分析が臨床的に有用であり, PWLモデルの有効性を検証する最善の方法の1つであることを示す。
まず、RNA-seqデータを用いてPWLモデルを訓練し、PAM50固有のサブタイプを予測し、サブタイプ予測タスクを通じてPAM50の41/50遺伝子に適用した。
第2に,PAM50サブタイプと乳癌のコピー数との関係を明らかにするための深部濃縮分析法を開発した。
以上の結果から,pwlモデルは細胞周期関連経路に関連する遺伝子を利用した。
これらの乳がん亜型分析の予備的成功は,乳癌の根底にあるメカニズムを解明し,全体の臨床成績を改善するための分析戦略の可能性を示している。
関連論文リスト
- Deep learning-based classification of breast cancer molecular subtypes from H&E whole-slide images [0.0]
乳がんの分子サブタイプを予測するために,H&Eによる全スライド画像の活用が可能であるかを検討した。
乳がんの1,433 WSIを2段階のパイプラインで用いた。まず,腫瘍と非腫瘍タイルの分類を行い,腫瘍領域のみを分子サブタイピングに用いた。
パイプラインは221個のWSIで試験され、腫瘍検出には0.95点、分子置換には0.73点のマクロF1スコアが得られた。
論文 参考訳(メタデータ) (2024-08-30T13:57:33Z) - Predicting Lung Cancer Patient Prognosis with Large Language Models [20.97970447748789]
大規模言語モデル(LLM)は、広範な学習知識に基づいてテキストを処理・生成する能力に注目されている。
肺癌患者の予後予測におけるGPT-4o miniおよびGPT-3.5の有用性について検討した。
論文 参考訳(メタデータ) (2024-08-15T06:36:27Z) - Predictive Modeling for Breast Cancer Classification in the Context of Bangladeshi Patients: A Supervised Machine Learning Approach with Explainable AI [0.0]
5種類の機械学習手法の分類精度,精度,リコール,F-1スコアを評価し,比較した。
XGBoostは97%という最高のモデル精度を達成した。
論文 参考訳(メタデータ) (2024-04-06T17:23:21Z) - Histopathologic Cancer Detection [0.0]
この作業では、PatchCamelyonベンチマークデータセットを使用して、モデルをマルチレイヤのパーセプトロンと畳み込みモデルでトレーニングし、精度の高いリコール、F1スコア、精度、AUCスコアでモデルのパフォーマンスを観察する。
また,データ拡張を伴うResNet50とInceptionNetモデルを導入し,ResNet50が最先端モデルに勝てることを示す。
論文 参考訳(メタデータ) (2023-11-13T19:51:46Z) - PACS: Prediction and analysis of cancer subtypes from multi-omics data
based on a multi-head attention mechanism model [2.275409158519155]
がんサブタイプの分類を成功させるために, 教師付きマルチヘッドアテンション機構モデル(SMA)を提案する。
SMAモデルのアテンション機構と特徴共有モジュールは、マルチオミクスデータのグローバルおよびローカルの特徴情報をうまく学習することができる。
SMAモデルは、シミュレーションされた単一細胞およびがんマルチオミクスデータセットにおけるがんサブタイプの最も正確なF1マクロスコープ、F1重み付きおよび正確な分類を達成する。
論文 参考訳(メタデータ) (2023-08-21T03:54:21Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。