論文の概要: deepNoC: A deep learning system to assign the number of contributors to a short tandem repeat DNA profile
- arxiv url: http://arxiv.org/abs/2412.09803v1
- Date: Fri, 13 Dec 2024 02:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:01:41.567741
- Title: deepNoC: A deep learning system to assign the number of contributors to a short tandem repeat DNA profile
- Title(参考訳): DeepNoC: 短いタンデムリピートDNAプロファイルにコントリビュータの数を割り当てるディープラーニングシステム
- Authors: Duncan Taylor, Melissa A. Humphries,
- Abstract要約: 我々はSTRプロファイルの電気泳動信号をシミュレートする解析パイプラインを開発し、事実上無制限に事前の学習材料を生成することができる。
我々は、100万のプロファイルをシミュレートして、ディープニューラルネットワークアーキテクチャ(DeepNoCという名前のアルゴリズム)を使用して、多くのコントリビュータ推定ツールをトレーニングすることにより、高いレベルのパフォーマンスが1から10のコントリビュータに対して89%達成されていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: A common task in forensic biology is to interpret and evaluate short tandem repeat DNA profiles. The first step in these interpretations is to assign a number of contributors to the profiles, a task that is most often performed manually by a scientist using their knowledge of DNA profile behaviour. Studies using constructed DNA profiles have shown that as DNA profiles become more complex, and the number of DNA-donating individuals increases, the ability for scientists to assign the target number. There have been a number of machine learning algorithms developed that seek to assign the number of contributors to a DNA profile, however due to practical limitations in being able to generate DNA profiles in a laboratory, the algorithms have been based on summaries of the available information. In this work we develop an analysis pipeline that simulates the electrophoretic signal of an STR profile, allowing virtually unlimited, pre-labelled training material to be generated. We show that by simulating 100 000 profiles and training a number of contributors estimation tool using a deep neural network architecture (in an algorithm named deepNoC) that a high level of performance is achieved (89% for 1 to 10 contributors). The trained network can then have fine-tuning training performed with only a few hundred profiles in order to achieve the same accuracy within a specific laboratory. We also build into deepNoC secondary outputs that provide a level of explainability to a user of algorithm, and show how they can be displayed in an intuitive manner.
- Abstract(参考訳): 法医学生物学における一般的な課題は、短いタンデム反復DNAプロファイルを解釈し、評価することである。
これらの解釈の最初のステップは、多くのコントリビュータをプロファイルに割り当てることである。
構築されたDNAプロファイルを用いた研究は、DNAプロファイルが複雑になり、DNAを付加する個体の数が増加するにつれて、科学者が対象とする個体数を割り当てる能力が増すことを示した。
DNAプロファイルにコントリビュータの数を割り当てるための機械学習アルゴリズムが開発されているが、実験室でDNAプロファイルを生成できることの現実的な制限のため、アルゴリズムは利用可能な情報の要約に基づいている。
本研究では、STRプロファイルの電気泳動信号をシミュレートする解析パイプラインを開発し、実質的に無制限な事前学習材料を生成する。
我々は、100万のプロファイルをシミュレートし、ディープニューラルネットワークアーキテクチャ(DeepNoCという名前のアルゴリズム)を使用して多くのコントリビュータ推定ツールをトレーニングすることにより、高いレベルのパフォーマンス(1から10のコントリビュータに対して89%)を達成することを示す。
トレーニングされたネットワークは、数百のプロファイルだけで、特定の実験室内で同じ精度を達成するための微調整訓練を行うことができる。
また、DeepNoCセカンダリ出力を組み込んで、アルゴリズムのユーザに対して説明可能性のレベルを提供し、どのように直感的に表示できるかを示します。
関連論文リスト
- Simulating realistic short tandem repeat capillary electrophoretic signal using a generative adversarial network [0.0]
我々は,この課題を達成するために,画素GANから修正した生成逆数ネットワークであるGANを開発した。
1078のDNAプロファイルで、私たちはGANを訓練し、DNAプロファイル情報をシミュレートする能力を達成する。
論文 参考訳(メタデータ) (2024-08-28T23:20:17Z) - Dy-mer: An Explainable DNA Sequence Representation Scheme using Sparse Recovery [6.733319363951907]
textbfDy-merはスパースリカバリに基づく説明可能で堅牢な表現スキームである。
DNAプロモーターの分類における最先端のパフォーマンスを達成し、textbf13%の精度向上をもたらす。
論文 参考訳(メタデータ) (2024-07-06T15:08:31Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - DNAGPT: A Generalized Pre-trained Tool for Versatile DNA Sequence
Analysis Tasks [14.931476374660944]
DNAGPTは、全哺乳類から200億以上の塩基対をトレーニングした、一般的なDNA事前学習モデルである。
古典的なGPTモデルをバイナリ分類タスク、数値回帰タスク、包括的トークン言語で拡張することにより、DNAGPTは汎用的なDNA解析タスクを処理できる。
論文 参考訳(メタデータ) (2023-07-11T06:30:43Z) - Efficient Automation of Neural Network Design: A Survey on
Differentiable Neural Architecture Search [70.31239620427526]
微分可能なニューラルネットワーク探索(DNAS)は、ディープニューラルネットワークアーキテクチャの発見を自動化するトレンドのアプローチとして、急速に自らを強制した。
この増加は主に、最初の主要なDNAS法の一つであるDARTSの人気が原因である。
本総説では,DNASに特に焦点をあて,最近のアプローチを概観する。
論文 参考訳(メタデータ) (2023-04-11T13:15:29Z) - Natural language processing for clusterization of genes according to
their functions [62.997667081978825]
本稿では,数千の遺伝子の解析を減らし,複数のクラスタの解析を行うアプローチを提案する。
これらの記述は、事前訓練された言語モデル(BERT)といくつかのテキスト処理アプローチを用いてベクトルとして符号化される。
論文 参考訳(メタデータ) (2022-07-17T12:59:34Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Exploring the Common Principal Subspace of Deep Features in Neural
Networks [50.37178960258464]
我々は、同じデータセットでトレーニングされた異なるディープニューラルネットワーク(DNN)が、潜在空間において共通の主部分空間を共有することを発見した。
具体的には、DNNで学んだ深い機能の主部分空間を表すために、$mathcalP$-vectorを新たに設計する。
異なるアルゴリズム/アーキテクチャで訓練された2つのDNNの比較では、小さな角度(コサインが1.0ドルに近い)が見つかっている。
論文 参考訳(メタデータ) (2021-10-06T15:48:32Z) - DNA mixture deconvolution using an evolutionary algorithm with multiple
populations, hill-climbing, and guided mutation [0.8029049649310211]
DNAは、法医学遺伝学で分析された犯罪事例をサンプリングし、複数の貢献者からのDNAを頻繁に含む。
1つ以上のコントリビュータが不明な場合には、関心の対象は、これらの未知のプロファイルの分離であり、しばしば非畳み込み(deconvolution)と呼ばれる。
我々は、未知のDNAプロファイルのデコンボリューションを得るために、多集団進化アルゴリズム(MEA)を導入した。
論文 参考訳(メタデータ) (2020-12-01T14:23:55Z) - A deep learning classifier for local ancestry inference [63.8376359764052]
局所祖先推論は、個人のゲノムの各セグメントの祖先を特定する。
我々は,エンコーダ・デコーダアーキテクチャを備えた深層畳み込みニューラルネットワークを用いた新しいLAIツールを開発した。
我々は,既存のゴールド標準ツール RFMix とほぼ同等の精度で,ゼロショットタスクとしてアドミキシングを学習できることを実証した。
論文 参考訳(メタデータ) (2020-11-04T00:42:01Z) - Deep Representational Similarity Learning for analyzing neural
signatures in task-based fMRI dataset [81.02949933048332]
本稿では、表現類似度分析(RSA)の深部拡張であるDRSL(Deep Representational similarity Learning)を開発する。
DRSLは、多数の被験者を持つfMRIデータセットにおける様々な認知タスク間の類似性を分析するのに適している。
論文 参考訳(メタデータ) (2020-09-28T18:30:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。