論文の概要: DNA Methylation Data to Predict Suicidal and Non-Suicidal Deaths: A
Machine Learning Approach
- arxiv url: http://arxiv.org/abs/2004.01819v1
- Date: Sat, 4 Apr 2020 00:34:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 22:53:02.629352
- Title: DNA Methylation Data to Predict Suicidal and Non-Suicidal Deaths: A
Machine Learning Approach
- Title(参考訳): DNAメチル化データによる自殺・非自殺の予測:機械学習によるアプローチ
- Authors: Rifat Zahan, Ian McQuillan and Nathaniel D. Osgood
- Abstract要約: 本研究の目的は,最新の機械学習アルゴリズムを用いてDNAメチル化データから自殺死・非自殺死を予測することである。
サポートベクターマシンを用いて,メチル化DNAプローブ強度の正規化値からなる既存の二次データを分類した。
クロスバリデーションを用いたにもかかわらず、BA11データに対する自殺死の予測は名目上完全なものであり、モデルの過度な適合の可能性を示している。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of this study is to predict suicidal and non-suicidal deaths
from DNA methylation data using a modern machine learning algorithm. We used
support vector machines to classify existing secondary data consisting of
normalized values of methylated DNA probe intensities from tissues of two
cortical brain regions to distinguish suicide cases from control cases. Before
classification, we employed Principal component analysis (PCA) and
t-distributed Stochastic Neighbor Embedding (t-SNE) to reduce the dimension of
the data. In comparison to PCA, the modern data visualization method t-SNE
performs better in dimensionality reduction. t-SNE accounts for the possible
non-linear patterns in low-dimensional data. We applied four-fold
cross-validation in which the resulting output from t-SNE was used as training
data for the Support Vector Machine (SVM). Despite the use of cross-validation,
the nominally perfect prediction of suicidal deaths for BA11 data suggests
possible over-fitting of the model. The study also may have suffered from
'spectrum bias' since the individuals were only studied from two extreme
scenarios. This research constitutes a baseline study for classifying suicidal
and non-suicidal deaths from DNA methylation data. Future studies with larger
sample size, while possibly incorporating methylation data from living
individuals, may reduce the bias and improve the accuracy of the results.
- Abstract(参考訳): 本研究の目的は,最新の機械学習アルゴリズムを用いてDNAメチル化データから自殺・非自殺死を予測することである。
サポートベクターマシンを用いて,2つの皮質脳領域の組織からメチル化DNAプローブ強度の正規化値からなる既存の二次データを分類し,自殺事例と制御事例を区別した。
分類に先立ち, 主成分分析 (PCA) と t-distributed Stochastic Neighbor Embedding (T-SNE) を用い, データの寸法を小さくした。
PCAと比較して、現代のデータ可視化手法t-SNEは次元の低減に優れる。
t-SNEは低次元データにおける非線形パターンの可能性を説明できる。
サポートベクターマシン(svm)のトレーニングデータとしてt-sneから出力される4次元クロスバリデーションを適用した。
クロスバリデーションを用いたにもかかわらず、BA11データに対する自殺死の予測は名目上完全なものであり、モデルの過剰適合の可能性を示している。
この研究は、2つの極端なシナリオからのみ研究されたため、「スペクトルバイアス」に悩まされた可能性がある。
本研究はDNAメチル化データから自殺死・非自殺死を分類するための基礎研究である。
将来、サンプルサイズが大きくなると、生体からのメチル化データが組み込まれ、バイアスが減少し、結果の正確性が向上する可能性がある。
関連論文リスト
- SGUQ: Staged Graph Convolution Neural Network for Alzheimer's Disease Diagnosis using Multi-Omics Data [7.090283934070421]
アルツハイマー病(英語: Alzheimer's disease、AD)は、慢性神経変性疾患であり、認知症の主要な原因である。
従来のアプローチでは、通常、最適なAD診断を達成するために、すべてのオミクスデータを最初から完了する必要がある。
我々は不確実性定量化(SGUQ)を用いたグラフ畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2024-10-14T19:51:32Z) - Unlearnable Examples Detection via Iterative Filtering [84.59070204221366]
ディープニューラルネットワークは、データ中毒攻撃に弱いことが証明されている。
混合データセットから有毒なサンプルを検出することは極めて有益であり、困難である。
UE識別のための反復フィルタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-15T13:26:13Z) - Ischemic Stroke Lesion Prediction using imbalanced Temporal Deep
Gaussian Process (iTDGP) [2.649401887836554]
急性虚血性脳卒中(AIS)は、動脈閉塞により突然脳への血液供給が中断されたときに起こる。
CT(Computed Tomography Perfusion)画像から抽出した3次元計測マップをしきい値として評価する現在の標準AIS評価法は十分ではない。
ベースラインガウス時系列を用いてAIS予測を改善する確率モデルであるiTDGPを提案する。
論文 参考訳(メタデータ) (2022-11-16T17:32:29Z) - Compensating trajectory bias for unsupervised patient stratification
using adversarial recurrent neural networks [0.6323908398583082]
患者埋め込みやクラスタは,軌道バイアスの影響を受けやすい可能性が示唆された。
結果は、臨床的に関係のある詳細ではなく、各患者の軌跡に含まれるデータ量に支配される。
本稿では,RNN-AE上での逆トレーニング手法を用いてこの問題を克服する手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T09:01:28Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Quantification of pulmonary involvement in COVID-19 pneumonia by means
of a cascade oftwo U-nets: training and assessment on multipledatasets using
different annotation criteria [83.83783947027392]
本研究は、新型コロナウイルスの肺病変の同定、セグメント化、定量化のために人工知能(AI)を活用することを目的とする。
2つのU-netのカスケードをベースとした自動解析パイプラインLungQuantシステムを開発した。
LungQuantシステムにおけるCT-Severity Score(CT-SS)の精度も評価した。
論文 参考訳(メタデータ) (2021-05-06T10:21:28Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z) - Handling Non-ignorably Missing Features in Electronic Health Records
Data Using Importance-Weighted Autoencoders [8.518166245293703]
本稿では,生体データのランダムなパターンではなく,欠落を柔軟に扱うために,重要度重み付きオートエンコーダ(iwaes)と呼ばれるvaesの新たな拡張を提案する。
提案手法は,組み込みニューラルネットワークを用いて欠落機構をモデル化し,欠落機構の正確な形式を事前に指定する必要をなくした。
論文 参考訳(メタデータ) (2021-01-18T22:53:29Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - Machine Learning and Data Science approach towards trend and predictors
analysis of CDC Mortality Data for the USA [0.0]
調査では、性別やその中心的な傾向に関わらず(サンプルに基づいて)平均寿命が決定された。
この研究は、機械学習の予測が、データにとって明らかなほど有効ではないことを示しています。
論文 参考訳(メタデータ) (2020-09-11T12:46:57Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。