論文の概要: Simulating realistic short tandem repeat capillary electrophoretic signal using a generative adversarial network
- arxiv url: http://arxiv.org/abs/2408.16169v1
- Date: Wed, 28 Aug 2024 23:20:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-30 15:34:56.816969
- Title: Simulating realistic short tandem repeat capillary electrophoretic signal using a generative adversarial network
- Title(参考訳): 生成対向ネットワークを用いた実時間短タンデム繰り返し毛細管電気泳動信号のシミュレーション
- Authors: Duncan Taylor, Melissa Humphries,
- Abstract要約: 我々は,この課題を達成するために,画素GANから修正した生成逆数ネットワークであるGANを開発した。
1078のDNAプロファイルで、私たちはGANを訓練し、DNAプロファイル情報をシミュレートする能力を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA profiles are made up from multiple series of electrophoretic signal measuring fluorescence over time. Typically, human DNA analysts 'read' DNA profiles using their experience to distinguish instrument noise, artefactual signal, and signal corresponding to DNA fragments of interest. Recent work has developed an artificial neural network, ANN, to carry out the task of classifying fluorescence types into categories in DNA profile electrophoretic signal. But the creation of the necessarily large amount of labelled training data for the ANN is time consuming and expensive, and a limiting factor in the ability to robustly train the ANN. If realistic, prelabelled, training data could be simulated then this would remove the barrier to training an ANN with high efficacy. Here we develop a generative adversarial network, GAN, modified from the pix2pix GAN to achieve this task. With 1078 DNA profiles we train the GAN and achieve the ability to simulate DNA profile information, and then use the generator from the GAN as a 'realism filter' that applies the noise and artefact elements exhibited in typical electrophoretic signal.
- Abstract(参考訳): DNAプロファイルは、時間とともに蛍光を測定する複数の電気泳動信号から作られる。
典型的には、人間のDNA分析者は、その経験を使って、楽器のノイズ、人工的な信号、および興味あるDNA断片に対応する信号を識別するDNAプロファイルを読み取る。
最近の研究は、蛍光型をDNAプロファイル電気泳動信号のカテゴリに分類するタスクを実行するために、人工知能ニューラルネットワークであるANNを開発した。
しかし、ANNのための大量のラベル付きトレーニングデータの作成には時間と費用がかかり、ANNを堅牢にトレーニングする能力の制限要因となる。
もし現実的でプレラベリングされたトレーニングデータをシミュレートできれば、高い有効性でANNをトレーニングする障壁を取り除くことができる。
そこで本研究では,Pix2pix GANから修正した生成逆数ネットワークであるGANを開発し,その課題を解決した。
1078のDNAプロファイルを用いて、私たちはGANを訓練し、DNAプロファイル情報をシミュレートする能力を実現し、GANからのジェネレータを「リアリズムフィルタ」として使用し、典型的な電気泳動信号で現れるノイズや人工物要素を適用します。
関連論文リスト
- VADA: a Data-Driven Simulator for Nanopore Sequencing [3.909855210960908]
本稿では,自己回帰潜在変数モデルに基づいて,ナノ孔をシミュレーションする純粋データ駆動手法を提案する。
実験的なナノ孔データに対して,本モデルが競合シミュレーション性能を実現することを実証的に実証した。
我々は,DNAラベルから予測される情報的潜伏表現を学習したことを示す。
論文 参考訳(メタデータ) (2024-04-12T13:24:28Z) - Data-Independent Operator: A Training-Free Artifact Representation
Extractor for Generalizable Deepfake Detection [105.9932053078449]
本研究では,より一般的な人工物表現を捉えるのに,小型かつトレーニング不要なフィルタが十分であることを示す。
トレーニングソースとテストソースの両方に不偏があるため、未確認ソースに対して魅力的な改善を実現するために、Data-Independent Operator (DIO)と定義する。
我々の検出器は13.3%の大幅な改善を実現し、新しい最先端の性能を確立した。
論文 参考訳(メタデータ) (2024-03-11T15:22:28Z) - Latent Diffusion Model for DNA Sequence Generation [5.194506374366898]
離散DNA配列生成に適した新しい潜伏拡散モデル DiscDiff を提案する。
離散DNA配列をオートエンコーダを用いて連続潜伏空間に埋め込むことで、離散データの生成に連続拡散モデルの強力な生成能力を活用できる。
我々は15種から150Kのプロモーター遺伝子配列の包括的クロス種データセットを寄贈し、ゲノム学における将来的な遺伝子モデリングのための資源を充実させた。
論文 参考訳(メタデータ) (2023-10-09T20:58:52Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Generative Adversarial Networks for Data Augmentation [0.0]
GANは、データ拡張、画像生成、ドメイン適応など、さまざまなタスクで医療画像解析に利用されてきた。
GANは利用可能なデータセットを増やすために使用できる合成サンプルを生成することができる。
医用画像におけるGANの使用は, 画像が高品質で, 臨床現場での使用に適していることを保証するために, 依然として研究の活発な領域である点に留意する必要がある。
論文 参考訳(メタデータ) (2023-06-03T06:33:33Z) - NeRF2: Neural Radio-Frequency Radiance Fields [11.09253326813424]
NeRF$textbf2$は、RF信号の伝搬を理解する連続ボリュームシーン関数を表す。
NeRF$textbf2$は、送信機の位置を知っているとき、どのような信号がどの位置で受信されたかを知ることができる。
論文 参考訳(メタデータ) (2023-05-10T13:09:57Z) - How far generated data can impact Neural Networks performance? [2.578242050187029]
ニューラルネットワークの性能向上において、生成したデータが実際のデータにどの程度役立つかを検討する。
実験の結果,実データに対する5倍の合成データが精度16%向上することが判明した。
論文 参考訳(メタデータ) (2023-03-27T14:02:43Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Convolutional Neural Networks for Sleep Stage Scoring on a Two-Channel
EEG Signal [63.18666008322476]
睡眠障害は、世界中の主要な病気の1つです。
専門家が使用する基本的なツールはPolysomnogramで、睡眠中に記録された様々な信号の集合である。
専門家は、標準的なガイドラインの1つに従って異なる信号を採点する必要があります。
論文 参考訳(メタデータ) (2021-03-30T09:59:56Z) - Semi-supervised deep learning based on label propagation in a 2D
embedded space [117.9296191012968]
提案されたソリューションは、少数の教師なしイメージから多数の教師なしイメージにラベルを伝達し、ディープニューラルネットワークモデルをトレーニングする。
本稿では、より正確なラベル付きサンプルを反復してセットから深層ニューラルネットワーク(VGG-16)をトレーニングするループを提案する。
ラベル付きセットがイテレーションに沿って改善されるにつれて、ニューラルネットワークの機能が改善される。
論文 参考訳(メタデータ) (2020-08-02T20:08:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。