論文の概要: Deep learning generates custom-made logistic regression models for
explaining how breast cancer subtypes are classified
- arxiv url: http://arxiv.org/abs/2001.06988v2
- Date: Tue, 19 Jul 2022 03:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 04:56:23.263461
- Title: Deep learning generates custom-made logistic regression models for
explaining how breast cancer subtypes are classified
- Title(参考訳): 深層学習は、乳がんサブタイプがどのように分類されるかを説明するカスタムメイドロジスティック回帰モデルを生成する
- Authors: Takuma Shibahara, Chisa Wada, Yasuho Yamashita, Kazuhiro Fujita,
Masamichi Sato, Junichi Kuwata, Atsushi Okamoto, and Yoshimasa Ono
- Abstract要約: 我々は,各患者に対してカスタムメイドのロジスティック回帰を生成するPWLモデルという説明可能なディープラーニングモデルを開発した。
我々は、RNA-seqデータを用いてPWLモデルを訓練し、PAM50固有のサブタイプを予測し、サブタイプ予測タスクを通じてPAM50の41/50遺伝子に適用した。
- 参考スコア(独自算出の注目度): 0.2529563359433233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Differentiating the intrinsic subtypes of breast cancer is crucial for
deciding the best treatment strategy. Deep learning can predict the subtypes
from genetic information more accurately than conventional statistical methods,
but to date, deep learning has not been directly utilized to examine which
genes are associated with which subtypes. To clarify the mechanisms embedded in
the intrinsic subtypes, we developed an explainable deep learning model called
a point-wise linear (PWL) model that generates a custom-made logistic
regression for each patient. Logistic regression, which is familiar to both
physicians and medical informatics researchers, allows us to analyze the
importance of the feature variables, and the PWL model harnesses these
practical abilities of logistic regression. In this study, we show that
analyzing breast cancer subtypes is clinically beneficial for patients and one
of the best ways to validate the capability of the PWL model. First, we trained
the PWL model with RNA-seq data to predict PAM50 intrinsic subtypes and applied
it to the 41/50 genes of PAM50 through the subtype prediction task. Second, we
developed a deep enrichment analysis method to reveal the relationships between
the PAM50 subtypes and the copy numbers of breast cancer. Our findings showed
that the PWL model utilized genes relevant to the cell cycle-related pathways.
These preliminary successes in breast cancer subtype analysis demonstrate the
potential of our analysis strategy to clarify the mechanisms underlying breast
cancer and improve overall clinical outcomes.
- Abstract(参考訳): 乳がんの内因性サブタイプを区別することは治療戦略を決定する上で重要である。
深層学習は、従来の統計的手法よりも正確な遺伝情報からサブタイプを予測することができるが、現在まで、どのサブタイプに関連づけられた遺伝子を直接研究するために深層学習は使われていない。
内在サブタイプに埋め込まれたメカニズムを明らかにするため,各患者にカスタムメイドロジスティック回帰を生成するPWLモデルという,説明可能な深層学習モデルを開発した。
ロジスティック回帰は, 医師と医療情報学研究者の両方に親しまれており, 特徴変数の重要性を解析することが可能であり, PWLモデルはこれらのロジスティック回帰の実践的能力を利用する。
本研究は, 乳癌の亜型分析が臨床的に有用であり, PWLモデルの有効性を検証する最善の方法の1つであることを示す。
まず、RNA-seqデータを用いてPWLモデルを訓練し、PAM50固有のサブタイプを予測し、サブタイプ予測タスクを通じてPAM50の41/50遺伝子に適用した。
第2に,PAM50サブタイプと乳癌のコピー数との関係を明らかにするための深部濃縮分析法を開発した。
以上の結果から,pwlモデルは細胞周期関連経路に関連する遺伝子を利用した。
これらの乳がん亜型分析の予備的成功は,乳癌の根底にあるメカニズムを解明し,全体の臨床成績を改善するための分析戦略の可能性を示している。
関連論文リスト
- Cell Maps Representation For Lung Adenocarcinoma Growth Patterns
Classification In Whole Slide Images [0.6258701460323505]
肺腺癌は, 形態学的に異質な疾患であり, 5つの原発組織学的成長パターンを特徴とする。
組織タイルを5つのパターンの1つまたは非腫瘍の1つに分類できる新しい機械学習パイプラインを提案する。
論文 参考訳(メタデータ) (2023-11-27T14:12:51Z) - Histopathologic Cancer Detection [0.0]
この作業では、PatchCamelyonベンチマークデータセットを使用して、モデルをマルチレイヤのパーセプトロンと畳み込みモデルでトレーニングし、精度の高いリコール、F1スコア、精度、AUCスコアでモデルのパフォーマンスを観察する。
また,データ拡張を伴うResNet50とInceptionNetモデルを導入し,ResNet50が最先端モデルに勝てることを示す。
論文 参考訳(メタデータ) (2023-11-13T19:51:46Z) - PACS: Prediction and analysis of cancer subtypes from multi-omics data
based on a multi-head attention mechanism model [2.275409158519155]
がんサブタイプの分類を成功させるために, 教師付きマルチヘッドアテンション機構モデル(SMA)を提案する。
SMAモデルのアテンション機構と特徴共有モジュールは、マルチオミクスデータのグローバルおよびローカルの特徴情報をうまく学習することができる。
SMAモデルは、シミュレーションされた単一細胞およびがんマルチオミクスデータセットにおけるがんサブタイプの最も正確なF1マクロスコープ、F1重み付きおよび正確な分類を達成する。
論文 参考訳(メタデータ) (2023-08-21T03:54:21Z) - hist2RNA: An efficient deep learning architecture to predict gene
expression from breast cancer histopathology images [11.822321981275232]
深層学習アルゴリズムは、デジタル病理画像中の形態パターンを効果的に抽出し、分子の表現型を迅速かつ低コストで予測することができる。
我々は,138遺伝子の発現を予測するために,バルクRNAシークエンシング技術にインスパイアされたhist2RNAという新しい計算効率の高い手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T10:54:32Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Deep Learning Based Model for Breast Cancer Subtype Classification [3.419451872918847]
本稿では,乳癌の4つのサブタイプ(Basal,Her2,LumA,LumB)の分類における遺伝子発現データの利用に焦点を当てた。
オートエンコーダを用いて、特徴セットのサイズを20,530の遺伝子発現値から500に縮小する。
第1ステージと第2ステージのネットワークを併用することにより,TGA乳癌データセット上で平均10倍の精度0.907を達成できた。
論文 参考訳(メタデータ) (2021-11-06T17:15:35Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。