論文の概要: DNA mixture deconvolution using an evolutionary algorithm with multiple
populations, hill-climbing, and guided mutation
- arxiv url: http://arxiv.org/abs/2012.00513v1
- Date: Tue, 1 Dec 2020 14:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 04:19:51.720442
- Title: DNA mixture deconvolution using an evolutionary algorithm with multiple
populations, hill-climbing, and guided mutation
- Title(参考訳): 複数の個体群を持つ進化的アルゴリズムを用いたDNA混合脱畳畳み込み、ヒルクライミングおよび誘導突然変異
- Authors: S{\o}ren B. Vilsen, Torben Tvedebrink, and Poul Svante Eriksen
- Abstract要約: DNAは、法医学遺伝学で分析された犯罪事例をサンプリングし、複数の貢献者からのDNAを頻繁に含む。
1つ以上のコントリビュータが不明な場合には、関心の対象は、これらの未知のプロファイルの分離であり、しばしば非畳み込み(deconvolution)と呼ばれる。
我々は、未知のDNAプロファイルのデコンボリューションを得るために、多集団進化アルゴリズム(MEA)を導入した。
- 参考スコア(独自算出の注目度): 0.8029049649310211
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA samples crime cases analysed in forensic genetics, frequently contain DNA
from multiple contributors. These occur as convolutions of the DNA profiles of
the individual contributors to the DNA sample. Thus, in cases where one or more
of the contributors were unknown, an objective of interest would be the
separation, often called deconvolution, of these unknown profiles. In order to
obtain deconvolutions of the unknown DNA profiles, we introduced a multiple
population evolutionary algorithm (MEA). We allowed the mutation operator of
the MEA to utilise that the fitness is based on a probabilistic model and guide
it by using the deviations between the observed and the expected value for
every element of the encoded individual. This guided mutation operator (GM) was
designed such that the larger the deviation the higher probability of mutation.
Furthermore, the GM was inhomogeneous in time, decreasing to a specified lower
bound as the number of iterations increased. We analysed 102 two-person DNA
mixture samples in varying mixture proportions. The samples were quantified
using two different DNA prep. kits: (1) Illumina ForenSeq Panel B (30 samples),
and (2) Applied Biosystems Precision ID Globalfiler NGS STR panel (72 samples).
The DNA mixtures were deconvoluted by the MEA and compared to the true DNA
profiles of the sample. We analysed three scenarios where we assumed: (1) the
DNA profile of the major contributor was unknown, (2) DNA profile of the minor
was unknown, and (3) both DNA profiles were unknown. Furthermore, we conducted
a series of sensitivity experiments on the ForenSeq panel by varying the
sub-population size, comparing a completely random homogeneous mutation
operator to the guided operator with varying mutation decay rates, and allowing
for hill-climbing of the parent population.
- Abstract(参考訳): DNAは、法医学遺伝学で分析された犯罪事例をサンプリングし、しばしば複数のコントリビュータのDNAを含む。
これらは、DNAサンプルへの個々のコントリビュータのDNAプロファイルの畳み込みとして起こる。
したがって、貢献者が1人以上いない場合、関心の対象は、これらの未知のプロファイルの分離(しばしばデコンボリューションと呼ばれる)である。
未知のDNAプロファイルのデコンボリューションを得るため,多集団進化アルゴリズム(MEA)を導入した。
我々は、MEAの突然変異演算子に対して、その適合性は確率モデルに基づいており、符号化された個体のすべての要素に対する観測値と期待値との偏差を利用して誘導することを許した。
この誘導突然変異演算子(GM)は、より大きいほど突然変異の確率が高くなるように設計された。
さらにgmは時間的に不均一であり,イテレーション数の増加に伴い,一定の下限まで低下した。
異なる混合割合で102人のDNA混合物を解析した。
サンプルは2つの異なるDNAプレップを用いて定量化した。
キット: (1) Illumina ForenSeq Panel B (30サンプル), (2) Applied Biosystems Precision ID Globalfiler NGS STR panel (72サンプル)。
DNA混合物はMEAによって分解され、サンプルの真のDNAプロファイルと比較された。
そこで本研究では,(1)主犯のDNAプロファイルが不明,(2)未成年者のDNAプロファイルが不明,(3)両DNAプロファイルが不明であった3つのシナリオを分析した。
さらに,ForenSeqパネルのサブポピュレーションサイズを変動させ,完全ランダムな同種突然変異演算子と誘導演算子を比較し,変異崩壊率を変動させ,親集団の丘登りを可能にする一連の感度実験を行った。
関連論文リスト
- Dy-mer: An Explainable DNA Sequence Representation Scheme using Sparse Recovery [6.733319363951907]
textbfDy-merはスパースリカバリに基づく説明可能で堅牢な表現スキームである。
DNAプロモーターの分類における最先端のパフォーマンスを達成し、textbf13%の精度向上をもたらす。
論文 参考訳(メタデータ) (2024-07-06T15:08:31Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - DNABERT-S: Pioneering Species Differentiation with Species-Aware DNA Embeddings [7.822348354050447]
DNABERT-S(DNABERT-S)は,異なる種のDNA配列を自然にクラスターし,分離するために,種認識の埋め込みを開発するゲノムモデルである。
23の多様なデータセットの創発的な結果は、特に現実的なラベルスカースシナリオにおいて、DNABERT-Sの有効性を示している。
論文 参考訳(メタデータ) (2024-02-13T20:21:29Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Graph Neural Networks for Microbial Genome Recovery [64.91162205624848]
本稿では,グラフニューラルネットワーク(GNN)を用いて,メダゲノミクスビニングのためのコンティグ表現を学習する際のアセンブリグラフを活用することを提案する。
提案手法であるVaeG-Binは,個々のコンティグの潜在表現を学習するための変分オートエンコーダと,アセンブリグラフ内のコンティグの近傍構造を考慮したGNNを組み合わせる。
論文 参考訳(メタデータ) (2022-04-26T12:49:51Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Private DNA Sequencing: Hiding Information in Discrete Noise [6.647959476396793]
そこで本研究では,DNAサンプルを混合した付加雑音で2変数変数$X$を隠蔽する問題について検討する。
この問題の解に対する上界と下界を特徴付けるが、これは経験的に非常に近いことが示される。
論文 参考訳(メタデータ) (2021-01-28T17:13:26Z) - A deep learning classifier for local ancestry inference [63.8376359764052]
局所祖先推論は、個人のゲノムの各セグメントの祖先を特定する。
我々は,エンコーダ・デコーダアーキテクチャを備えた深層畳み込みニューラルネットワークを用いた新しいLAIツールを開発した。
我々は,既存のゴールド標準ツール RFMix とほぼ同等の精度で,ゼロショットタスクとしてアドミキシングを学習できることを実証した。
論文 参考訳(メタデータ) (2020-11-04T00:42:01Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。