論文の概要: Incorporating Prior Knowledge in Deep Learning Models via Pathway
Activity Autoencoders
- arxiv url: http://arxiv.org/abs/2306.05813v1
- Date: Fri, 9 Jun 2023 11:12:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 13:38:38.128299
- Title: Incorporating Prior Knowledge in Deep Learning Models via Pathway
Activity Autoencoders
- Title(参考訳): 経路活動オートエンコーダを用いた深層学習モデルの事前知識の導入
- Authors: Pedro Henrique da Costa Avelar, Min Wu, Sophia Tsoka
- Abstract要約: 本稿では,癌におけるRNA-seqデータのための,事前知識に基づく新しいディープオートエンコーディングフレームワークPAAEを提案する。
機能セットが小さいにもかかわらず,PAAEモデルとPAAEモデルでは,一般的な手法と比較して,アウト・オブ・セットの再現性が向上していることを示す。
- 参考スコア(独自算出の注目度): 5.950889585409067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: Despite advances in the computational analysis of high-throughput
molecular profiling assays (e.g. transcriptomics), a dichotomy exists between
methods that are simple and interpretable, and ones that are complex but with
lower degree of interpretability. Furthermore, very few methods deal with
trying to translate interpretability in biologically relevant terms, such as
known pathway cascades. Biological pathways reflecting signalling events or
metabolic conversions are Small improvements or modifications of existing
algorithms will generally not be suitable, unless novel biological results have
been predicted and verified. Determining which pathways are implicated in
disease and incorporating such pathway data as prior knowledge may enhance
predictive modelling and personalised strategies for diagnosis, treatment and
prevention of disease.
Results: We propose a novel prior-knowledge-based deep auto-encoding
framework, PAAE, together with its accompanying generative variant, PAVAE, for
RNA-seq data in cancer. Through comprehensive comparisons among various
learning models, we show that, despite having access to a smaller set of
features, our PAAE and PAVAE models achieve better out-of-set reconstruction
results compared to common methodologies. Furthermore, we compare our model
with equivalent baselines on a classification task and show that they achieve
better results than models which have access to the full input gene set.
Another result is that using vanilla variational frameworks might negatively
impact both reconstruction outputs as well as classification performance.
Finally, our work directly contributes by providing comprehensive
interpretability analyses on our models on top of improving prognostication for
translational medicine.
- Abstract(参考訳): モチベーション(Motivation): 高スループット分子プロファイリングアッセイ(例えば transcriptomics)の計算解析の進歩にもかかわらず、単純かつ解釈可能な方法と、複雑だが解釈可能性の低い方法の間に二分法が存在する。
さらに、既知の経路カスケードのような生物学的に関連する用語で解釈可能性の翻訳を試みる手法はほとんどない。
シグナル伝達現象や代謝変換を反映する生物学的経路は、新しい生物学的結果が予測され検証されない限り、既存のアルゴリズムの小さな改良や修正は一般的には適切ではない。
疾患にどの経路が関係しているかを判断し、先行知識としてそのような経路データを組み込むことは、疾患の診断、治療、予防のための予測モデリングおよびパーソナライズされた戦略を強化する可能性がある。
結果: 癌におけるRNAシークエンシングのための新しい知識ベースディープオートエンコーディングフレームワークPAAEと,それに伴う遺伝子変異PAVAEを併用して提案する。
様々な学習モデル間の総合的な比較により, PAAEモデルとPAAEモデルは, 一般的な手法と比較して, より小さな特徴セットにアクセスできるにもかかわらず, より優れたアウト・オブ・セットの再構築結果が得られることを示した。
さらに,本モデルと分類タスクの等価なベースラインを比較し,全入力遺伝子セットにアクセス可能なモデルよりも優れた結果が得られることを示す。
もう一つの結果として、バニラ変分フレームワークの使用は、復元出力と分類性能の両方に悪影響を及ぼす可能性がある。
最後に,本研究は,翻訳医学の予後向上に資し,我々のモデルに対する包括的解釈可能性分析を提供することによって直接的に貢献する。
関連論文リスト
- Different Algorithms (Might) Uncover Different Patterns: A Brain-Age
Prediction Case Study [8.597209503064128]
脳波研究による脳年齢予測の確立された仮説が、アルゴリズム全体にわたって検証されるかどうかを検討する。
使用した特定のデータセットに対して最先端のパフォーマンスを達成したモデルはほとんどありません。
論文 参考訳(メタデータ) (2024-02-08T19:55:07Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - Exploration of the Rashomon Set Assists Trustworthy Explanations for
Medical Data [4.499833362998488]
本稿では,Rashomon集合におけるモデル探索の新たなプロセスを紹介し,従来のモデリング手法を拡張した。
動作の異なるモデルを検出するために,$textttRashomon_DETECT$アルゴリズムを提案する。
モデル間の変動効果の差を定量化するために,機能的データ解析に基づくプロファイル分散指数(PDI)を導入する。
論文 参考訳(メタデータ) (2023-08-22T13:53:43Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Using Explainable Boosting Machine to Compare Idiographic and Nomothetic
Approaches for Ecological Momentary Assessment Data [2.0824228840987447]
本稿では,非線形解釈型機械学習(ML)モデルを用いた分類問題について検討する。
木々の様々なアンサンブルは、不均衡な合成データセットと実世界のデータセットを用いて線形モデルと比較される。
2つの実世界のデータセットのうちの1つで、知識蒸留法は改善されたAUCスコアを達成する。
論文 参考訳(メタデータ) (2022-04-04T17:56:37Z) - Ensembling Handcrafted Features with Deep Features: An Analytical Study
for Classification of Routine Colon Cancer Histopathological Nuclei Images [13.858624044986815]
我々は,F1-measure,Precision,Recall,AUC,Cross-Entropy Lossを用いて,提案手法の性能解析を行った。
以上の結果から,DL特徴のアンサンブルがモデル全体の性能を著しく向上させることが明らかとなった。
論文 参考訳(メタデータ) (2022-02-22T06:48:50Z) - EPICURE Ensemble Pretrained Models for Extracting Cancer Mutations from
Literature [12.620782629498814]
EPICUREは、条件付きランダムフィールドパターン層とスパン予測パターン層を備え、テキストからがんの突然変異を抽出するアンサンブル事前訓練モデルである。
3つのベンチマークデータセットの実験結果から,ベースラインモデルと比較して競争力のある結果が得られた。
論文 参考訳(メタデータ) (2021-06-11T09:08:15Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。