論文の概要: MuCoMiD: A Multitask Convolutional Learning Framework for miRNA-Disease
Association Prediction
- arxiv url: http://arxiv.org/abs/2108.04820v1
- Date: Sun, 8 Aug 2021 10:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 21:50:07.126463
- Title: MuCoMiD: A Multitask Convolutional Learning Framework for miRNA-Disease
Association Prediction
- Title(参考訳): MuCoMiD:miRNA-disease Association予測のためのマルチタスク畳み込み学習フレームワーク
- Authors: Thi Ngan Dong and Megha Khosla
- Abstract要約: 本稿では, MuCoMiD と呼ぶ新しいマルチタスク畳み込み方式を提案する。
MuCoMiDは、4つの異種生物情報ソースからの知識を取り入れつつ、自動特徴抽出を可能にする。
我々は、標準ベンチマークデータセットに関する大規模な実験と、より大規模な独立したテストセットとケーススタディを構築した。
MuCoMiDは、HMDDv2.0とHMDDv3.0データセットで5倍のCV評価を少なくとも5%改善し、最先端のアプローチよりも、目に見えない病気や目に見えない病気を持つ大規模独立テストセットで少なくとも49%改善した。
- 参考スコア(独自算出の注目度): 0.4061135251278187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Growing evidence from recent studies implies that microRNA or miRNA could
serve as biomarkers in various complex human diseases. Since wet-lab
experiments are expensive and time-consuming, computational techniques for
miRNA-disease association prediction have attracted a lot of attention in
recent years. Data scarcity is one of the major challenges in building reliable
machine learning models. Data scarcity combined with the use of pre-calculated
hand-crafted input features has led to problems of overfitting and data
leakage.
We overcome the limitations of existing works by proposing a novel
multi-tasking convolution-based approach, which we refer to as MuCoMiD. MuCoMiD
allows automatic feature extraction while incorporating knowledge from 4
heterogeneous biological information sources (interactions between
miRNA/diseases and protein-coding genes (PCG), miRNA family information, and
disease ontology) in a multi-task setting which is a novel perspective and has
not been studied before. The use of multi-channel convolutions allows us to
extract expressive representations while keeping the model linear and,
therefore, simple. To effectively test the generalization capability of our
model, we construct large-scale experiments on standard benchmark datasets as
well as our proposed larger independent test sets and case studies. MuCoMiD
shows an improvement of at least 5% in 5-fold CV evaluation on HMDDv2.0 and
HMDDv3.0 datasets and at least 49% on larger independent test sets with unseen
miRNA and diseases over state-of-the-art approaches. We share our code for
reproducibility and future research at
https://git.l3s.uni-hannover.de/dong/cmtt.
- Abstract(参考訳): 最近の研究から、microRNAやmiRNAが様々な複雑なヒト疾患のバイオマーカーとして機能する可能性が示唆されている。
湿式実験室実験は高価で時間がかかるため,近年,mirna-disease association prediction の計算手法が注目されている。
データ不足は、信頼できる機械学習モデルを構築する上での大きな課題のひとつだ。
データ不足と手作り入力機能の使用が組み合わさって、オーバーフィッティングやデータ漏洩の問題を引き起こしている。
我々は、MuCoMiDと呼ぶ新しいマルチタスク畳み込みベースのアプローチを提案することによって、既存の作品の限界を克服する。
MuCoMiDは、4つの異種生物情報ソース(miRNA/diseasesとタンパク質コード遺伝子(PCG)、miRNAファミリー情報、病気オントロジー)の知識を、新しい視点であり、これまで研究されていないマルチタスク設定に組み込んで、自動的な特徴抽出を可能にする。
マルチチャネル畳み込みを用いることで,モデルが線形かつ単純でありながら表現表現を抽出できる。
モデルの一般化能力を効果的に検証するために,提案する大規模独立テストセットとケーススタディとともに,標準ベンチマークデータセット上の大規模実験を構築した。
MuCoMiDは、HMDDv2.0とHMDDv3.0データセットの5倍CV評価において、少なくとも5%改善し、最先端のアプローチよりも、未確認のmiRNAと疾患を持つ大規模な独立したテストセットでは少なくとも49%改善している。
私たちは、再現性と将来の研究のためのコードをhttps://git.l3s.uni-hannover.de/dong/cmttで共有しています。
関連論文リスト
- Character-level Tokenizations as Powerful Inductive Biases for RNA Foundational Models [0.0]
RNAの挙動を理解し予測することは、RNAの構造と相互作用の複雑さのために困難である。
現在のRNAモデルは、タンパク質ドメインで観測された性能とはまだ一致していない。
ChaRNABERTは、確立されたベンチマークでいくつかのタスクで最先端のパフォーマンスに到達することができる。
論文 参考訳(メタデータ) (2024-11-05T21:56:16Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - DOCTOR: A Multi-Disease Detection Continual Learning Framework Based on Wearable Medical Sensors [3.088223994180069]
ウェアラブル医療センサ(WMS)に基づく多相検出連続学習フレームワークであるDOCTORを提案する。
マルチヘッドディープニューラルネットワーク(DNN)とリプレイスタイルのCLアルゴリズムを採用している。
平均テスト精度は1.43倍、F1スコアは1.25倍、後方転送は0.41倍である。
論文 参考訳(メタデータ) (2023-05-09T19:33:17Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Coupling Deep Imputation with Multitask Learning for Downstream Tasks on
Genomics Data [0.0]
本稿では,深層学習とマルチタスク学習を併用して,不足値のインパルス化が,最先端のパフォーマンス向上にどのように寄与するかを検討する。
本稿では,患者が1つを除いてすべてのモダリティを持つような値を暗示する,一般化された深層計算法を提案する。
対照的に、全てのモダリティを生存予測に用いた場合、マルチタスク学習だけでは統計的に有意な深層計算よりも優れていることが観察される。
論文 参考訳(メタデータ) (2022-04-28T09:48:15Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - Deep Learning in current Neuroimaging: a multivariate approach with
power and type I error control but arguable generalization ability [0.158310730488265]
ディープラーニングアーキテクチャを用いた分類の統計的意義を推定する非パラメトリックフレームワークを提案する。
ラベル置換試験は, クロスバリデーション (CV) と上界補正 (RUB) を併用した再置換を検証法として提案した。
我々は, CV法とRUB法が有意レベルに近い偽陽性率と許容可能な統計的力を提供することを置換試験で発見した。
論文 参考訳(メタデータ) (2021-03-30T21:15:39Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z) - Graph Convolution Networks Using Message Passing and Multi-Source
Similarity Features for Predicting circRNA-Disease Association [5.423563861462909]
本稿では,複数ソースの類似性情報を用いて構築されたグラフから特徴を学習し,循環RNA関連性を予測するグラフ畳み込みネットワークフレームワークを提案する。
種々の実験で5倍のクロスバリデーションが提案されたフレームワークは、circRNA-disease associationの予測に有望な結果を示している。
論文 参考訳(メタデータ) (2020-09-15T15:22:42Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。