論文の概要: Deep Unsupervised Identification of Selected SNPs between Adapted
Populations on Pool-seq Data
- arxiv url: http://arxiv.org/abs/2101.00004v1
- Date: Mon, 28 Dec 2020 22:28:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 10:54:12.968860
- Title: Deep Unsupervised Identification of Selected SNPs between Adapted
Populations on Pool-seq Data
- Title(参考訳): Pool-seqデータを用いた適応集団間選択SNPの同定
- Authors: Julia Siekiera and Stefan Kramer
- Abstract要約: SNPを同定する非監視パイプラインを提案する。
監視された差別者CNNを訓練し、異なる人口からのアライメントを区別します。
我々の解が統計的結果を拡張できることが示される。
- 参考スコア(独自算出の注目度): 4.94950858749529
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The exploration of selected single nucleotide polymorphisms (SNPs) to
identify genetic diversity between different sequencing population pools
(Pool-seq) is a fundamental task in genetic research. As underlying sequence
reads and their alignment are error-prone and univariate statistical solutions
only take individual positions of the genome into account, the identification
of selected SNPs remains a challenging process. Deep learning models like
convolutional neural networks (CNNs) are able to consider large input areas in
their decisions. We suggest an unsupervised pipeline to be independent of a
rarely known ground truth. We train a supervised discriminator CNN to
distinguish alignments from different populations and utilize the model for
unsupervised SNP calling by applying explainable artificial intelligence
methods. Our proposed multivariate method is based on two main assumptions: We
assume (i) that instances having a high predictive certainty of being
distinguishable are likely to contain genetic variants, and (ii) that selected
SNPs are located at regions with input features having the highest influence on
the model's decision process. We directly compare our method with statistical
results on two different Pool-seq datasets and show that our solution is able
to extend statistical results.
- Abstract(参考訳): 異なるシークエンシング集団プール(pool-seq)間の遺伝的多様性を特定するための選択された単一ヌクレオチド多型(snps)の探索は、遺伝子研究の基本的な課題である。
塩基配列の読み取りとそのアライメントはエラーを起こしやすく、単変量統計解はゲノムの個々の位置のみを考慮に入れているため、選択されたSNPの同定は難しい過程である。
convolutional neural networks(cnns)のようなディープラーニングモデルは、彼らの決定において大きな入力領域を考慮できる。
教師なしパイプラインは、ほとんど知られていない根拠の真理から独立していると提案する。
異なる集団からアライメントを区別するために教師付き判別器cnnを訓練し、説明可能な人工知能手法を適用して教師なしsnp呼び出しのモデルを利用する。
提案する多変量法は主に2つの仮定に基づいている: (i) 識別可能な高い予測的確実性を有するインスタンスが遺伝的変異を含む可能性が高いこと, (ii) 選択されたsnpがモデル決定プロセスに最も影響を及ぼす入力特徴を持つ領域に位置すること。
本手法を2つの異なるpool-seqデータセット上の統計結果と直接比較し,統計結果を拡張できることを示す。
関連論文リスト
- Computing Systemic Risk Measures with Graph Neural Networks [1.6874375111244329]
本稿では,明確にモデル化された二元的負債の金融ネットワークに対するシステム的リスク対策について検討する。
本研究では,システム的リスクと最適ランダムアロケーションの近似の数値計算法について検討する。
論文 参考訳(メタデータ) (2024-09-30T10:18:13Z) - Hypothesis-Driven Deep Learning for Out of Distribution Detection [0.8191518216608217]
本稿では,新しいサンプルがInDなのかOoDなのかを定量化する仮説駆動型手法を提案する。
細菌のサンプルを学習した深層学習モデルに適応させ,InDとOoDの潜伏反応の解釈的差異を明らかにする。
論文 参考訳(メタデータ) (2024-03-21T01:06:47Z) - Deep Neural Crossover [1.9950682531209156]
我々は、Deep Neural Crossover'(DNC)と呼ばれる、遺伝的アルゴリズム(GA)における新しいマルチペアクロスオーバー演算子を提案する。
親遺伝子をランダムに選別する従来のGAクロスオーバー演算子とは異なり、DNCは深層強化学習(DRL)とエンコーダ・デコーダアーキテクチャ(encoder-decoder architecture)の能力を利用して遺伝子を選択する。
DNCはドメイン非依存であり、他の問題領域にも容易に適用できる。
論文 参考訳(メタデータ) (2024-03-17T09:50:20Z) - Probabilistic Lexicase Selection [6.177959045971966]
本稿では,レキシケード選択の確率分布を効率的に近似する新しい親選択アルゴリズムである確率論的レキシケード選択(プレキシケード選択)を導入する。
提案手法は,セマンティック・アウェア選択法として優れた問題解決能力を示すだけでなく,選択プロセスの確率的表現の利点も示している。
論文 参考訳(メタデータ) (2023-05-19T13:57:04Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Debiased Graph Neural Networks with Agnostic Label Selection Bias [59.61301255860836]
既存のグラフニューラルネットワーク(GNN)のほとんどは、データの選択バイアスを考慮せずに提案されている。
本稿では,デコリレーションレギュレータを区別した新しいデバイアスドグラフニューラルネットワーク(DGNN)を提案する。
DGNNは既存のGNNを強化するフレキシブルなフレームワークである。
論文 参考訳(メタデータ) (2022-01-19T16:50:29Z) - Deep neural networks with controlled variable selection for the
identification of putative causal genetic variants [0.43012765978447565]
本稿では,遺伝的研究のための可変選択を制御した,アンサンブルを用いた解釈可能なニューラルネットワークモデルを提案する。
本手法の利点は,(1)遺伝的変異の非線形効果を柔軟にモデル化し,統計力を向上させること,(2)誤発見率を厳格に制御するために入力層内の複数のノックオフ,(3)重みパラメータやアクティベーションの数を大幅に減らし,計算効率を向上させること,を含む。
論文 参考訳(メタデータ) (2021-09-29T20:57:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。