論文の概要: Positive-Unlabelled Learning for Identifying New Candidate Dietary Restriction-related Genes among Ageing-related Genes
- arxiv url: http://arxiv.org/abs/2406.09898v1
- Date: Fri, 14 Jun 2024 10:14:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-17 14:14:45.460630
- Title: Positive-Unlabelled Learning for Identifying New Candidate Dietary Restriction-related Genes among Ageing-related Genes
- Title(参考訳): 老化関連遺伝子群における新規食事制限関連遺伝子同定のための正アンラベリード学習
- Authors: Jorge Paz-Ruza, Alex A. Freitas, Amparo Alonso-Betanzos, Bertha Guijarro-Berdiñas,
- Abstract要約: 食事制限(DR)は最も人気のある抗老化介入の1つであり、そのメカニズムに関連する遺伝子を徹底的に研究する。
近年、機械学習は老化関連遺伝子中のDR関連遺伝子を同定するために研究されている。
本研究では,2段階のポジティブ・アンラベリード(PU)学習パラダイムに基づく新しい遺伝子優先順位付け手法を提案する。
- 参考スコア(独自算出の注目度): 2.9748898344267785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dietary Restriction (DR) is one of the most popular anti-ageing interventions, prompting exhaustive research into genes associated with its mechanisms. Recently, Machine Learning (ML) has been explored to identify potential DR-related genes among ageing-related genes, aiming to minimize costly wet lab experiments needed to expand our knowledge on DR. However, to train a model from positive (DR-related) and negative (non-DR-related) examples, existing ML methods naively label genes without known DR relation as negative examples, assuming that lack of DR-related annotation for a gene represents evidence of absence of DR-relatedness, rather than absence of evidence; this hinders the reliability of the negative examples (non-DR-related genes) and the method's ability to identify novel DR-related genes. This work introduces a novel gene prioritization method based on the two-step Positive-Unlabelled (PU) Learning paradigm: using a similarity-based, KNN-inspired approach, our method first selects reliable negative examples among the genes without known DR associations. Then, these reliable negatives and all known positives are used to train a classifier that effectively differentiates DR-related and non-DR-related genes, which is finally employed to generate a more reliable ranking of promising genes for novel DR-relatedness. Our method significantly outperforms the existing state-of-the-art non-PU approach for DR-relatedness prediction in three relevant performance metrics. In addition, curation of existing literature finds support for the top-ranked candidate DR-related genes identified by our model.
- Abstract(参考訳): 食事制限(DR)は最も人気のある抗老化介入の1つであり、そのメカニズムに関連する遺伝子を徹底的に研究する。
近年、機械学習(ML)は、老化関連遺伝子中の潜在的なDR関連遺伝子を同定し、DRに関する知識を拡大するために必要なコストのかかる実験実験を最小化することを目的としている。しかし、既存のMLメソッドは、DR関連遺伝子を既知のDR関係のない遺伝子を負の例として、DR関連アノテーションが欠如していることが、DR関連遺伝子の欠如の証拠であることを仮定して、DR関連遺伝子を同定する能力と、DR関連遺伝子を新規に同定する能力の信頼性を阻害する。
本研究は,2段階の正アンラベレ学習パラダイムに基づく新しい遺伝子優先順位付け手法を提案する:類似性に基づくKNNに着想を得た手法を用いて,DR関連のない遺伝子の中から信頼できる負の例を選択する。
次に、これらの信頼された陰性およびすべての既知の陽性は、DR関連遺伝子と非DR関連遺伝子を効果的に区別する分類器を訓練するために使用され、新しいDR関連遺伝子に対するより信頼性の高いランキングを生成するために最終的に使用される。
本手法は,既存の非PU手法よりもDR関連性予測に優れることを示す。
さらに,既存文献のキュレーションにより,本モデルで同定された上位候補DR関連遺伝子のサポートも確認された。
関連論文リスト
- CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-phenotype Associations [6.5678927417916455]
我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文 参考訳(メタデータ) (2024-10-10T01:01:10Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Generalizing to Unseen Domains in Diabetic Retinopathy Classification [8.59772105902647]
糖尿病網膜症分類における分布や領域の特定にモデルを一般化する問題について検討した。
本稿では、視覚変換器の自己蒸留を実現するための、シンプルで効果的な領域一般化(DG)手法を提案する。
本稿では,オープンソースのDR分類データセット上での最先端DG手法の性能について報告する。
論文 参考訳(メタデータ) (2023-10-26T09:11:55Z) - Don't Miss Out on Novelty: Importance of Novel Features for Deep Anomaly
Detection [64.21963650519312]
異常検出(AD)は、正規性の学習モデルに適合しない観察を識別する重要なタスクである。
本稿では, 入力空間における説明不能な観測として, 説明可能性を用いた新しいAD手法を提案する。
当社のアプローチでは,複数のベンチマークにまたがる新たな最先端性を確立し,さまざまな異常な型を扱う。
論文 参考訳(メタデータ) (2023-10-01T21:24:05Z) - How to Train Your DRAGON: Diverse Augmentation Towards Generalizable
Dense Retrieval [80.54532535622988]
教師付き検索とゼロショット検索の両方において高い精度を達成するために、一般化可能な高密度検索を訓練できることが示される。
多様な拡張で訓練された高密度レトリバーであるDRAGONは、教師付きおよびゼロショット評価の両方において最先端の有効性を実現する最初のBERTベースサイズのDRである。
論文 参考訳(メタデータ) (2023-02-15T03:53:26Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Assessing putative bias in prediction of anti-microbial resistance from
real-world genotyping data under explicit causal assumptions [3.795323061432507]
サンプリングが非ランダム化されているため、AMR予測ツールの開発にはバイアスがかかる。
遺伝子型・フェノタイプAMRデータを用いたAMR予測における確率に基づく再バランスと共起調整の有効性を評価した。
論文 参考訳(メタデータ) (2021-07-06T21:19:21Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Bimodal Distribution Removal and Genetic Algorithm in Neural Network for
Breast Cancer Diagnosis [0.0]
本稿では,BDR (Bimodal Distribution removal) の目的癌診断分類問題に対する効果について検討する。
BDRプロセスは実際には分類性能に悪影響を及ぼす。
本稿では,遺伝的アルゴリズムを特徴選択のための効率的なツールとして検討する。
論文 参考訳(メタデータ) (2020-02-20T13:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。