論文の概要: Multiclass Disease Predictions Based on Integrated Clinical and Genomics
Datasets
- arxiv url: http://arxiv.org/abs/2006.07879v1
- Date: Sun, 14 Jun 2020 12:23:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 09:42:20.971637
- Title: Multiclass Disease Predictions Based on Integrated Clinical and Genomics
Datasets
- Title(参考訳): 統合的臨床・ゲノムデータに基づく多クラス疾患予測
- Authors: Moeez M. Subhani, Ashiq Anjum
- Abstract要約: 我々は臨床データとゲノムデータの両方から情報を利用する予測モデルを構築した。
出力クラス数が75であるマルチクラス分類には,革新的だがシンプルな方法が採用されている。
結果は、他の分類モデルと比較して一貫性があり、有能であった。
- 参考スコア(独自算出の注目度): 0.114219428942199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical predictions using clinical data by computational methods are common
in bioinformatics. However, clinical predictions using information from
genomics datasets as well is not a frequently observed phenomenon in research.
Precision medicine research requires information from all available datasets to
provide intelligent clinical solutions. In this paper, we have attempted to
create a prediction model which uses information from both clinical and
genomics datasets. We have demonstrated multiclass disease predictions based on
combined clinical and genomics datasets using machine learning methods. We have
created an integrated dataset, using a clinical (ClinVar) and a genomics (gene
expression) dataset, and trained it using instance-based learner to predict
clinical diseases. We have used an innovative but simple way for multiclass
classification, where the number of output classes is as high as 75. We have
used Principal Component Analysis for feature selection. The classifier
predicted diseases with 73\% accuracy on the integrated dataset. The results
were consistent and competent when compared with other classification models.
The results show that genomics information can be reliably included in datasets
for clinical predictions and it can prove to be valuable in clinical
diagnostics and precision medicine.
- Abstract(参考訳): バイオインフォマティクスでは, 臨床データを用いた臨床予測が一般的である。
しかし、ゲノムデータセットからの情報を用いた臨床予測は、研究で頻繁に見られる現象ではない。
精密医療研究は、インテリジェントな臨床ソリューションを提供するために、利用可能なすべてのデータセットの情報を必要とする。
本稿では,臨床データとゲノミクスデータの両方からの情報を用いた予測モデルの構築を試みた。
機械学習を用いて臨床とゲノムの複合データセットに基づく多クラス疾患予測を実証した。
臨床(clinvar)とゲノミクス(gene expression)データセットを用いて統合データセットを作成し,インスタンスベース学習者を用いて臨床疾患を予測する訓練を行った。
出力クラス数が75であるマルチクラス分類には,革新的だがシンプルな方法が採用されている。
特徴選択には主成分分析を用いた。
分類器は、統合データセット上で73\%の精度で疾患を予測した。
結果は他の分類モデルと比較すると一貫性があり有能であった。
その結果,ゲノミクス情報は臨床予測のためのデータセットに確実に含まれ,臨床診断や精密医療に有用であることが判明した。
関連論文リスト
- Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - sEHR-CE: Language modelling of structured EHR data for efficient and
generalizable patient cohort expansion [0.0]
sEHR-CEは、異種臨床データセットの統合表現型化と分析を可能にするトランスフォーマーに基づく新しいフレームワークである。
大規模研究である英国バイオバンクのプライマリ・セカンダリ・ケアデータを用いてアプローチを検証する。
論文 参考訳(メタデータ) (2022-11-30T16:00:43Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - TrialGraph: Machine Intelligence Enabled Insight from Graph Modelling of
Clinical Trials [0.0]
我々はCT.gov, AACT, TrialTroveデータベースから収集した治験データセット(n=1191臨床試験、100万人の患者を代表する)を紹介する。
次に,グラフ機械学習アルゴリズムの数学的基礎と実装について詳述する。
我々はこれらのモデルを用いて、疾患、既往の医療状況、治療に関する情報を与えられた臨床試験の副作用情報を予測する訓練を行った。
論文 参考訳(メタデータ) (2021-12-15T15:36:57Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - Simultaneous imputation and disease classification in incomplete medical
datasets using Multigraph Geometric Matrix Completion (MGMC) [37.160335232396406]
我々は,Multigraph Geometric Matrix Completionを用いて,不完全な医療データセットのインプットと疾患予測のエンドツーエンド学習を提案する。
我々は,最先端の手法と比較して,分類と計算性能の観点から,提案手法の優位性を実証的に示す。
論文 参考訳(メタデータ) (2020-05-14T13:11:35Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。