論文の概要: Trace Reconstruction Problems in Computational Biology
- arxiv url: http://arxiv.org/abs/2010.06083v1
- Date: Mon, 12 Oct 2020 23:52:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 08:18:13.454275
- Title: Trace Reconstruction Problems in Computational Biology
- Title(参考訳): 計算生物学におけるトレース再構成問題
- Authors: Vinnu Bhardwaj, Pavel A. Pevzner, Cyrus Rashtchian, Yana Safonova
- Abstract要約: 我々は,新しいトレース生成モデルと,免疫ゲノム学およびDNAデータ保存のためのトレース再構成に関するオープンな質問を紹介する。
免疫ゲノム学において、トレースは、適応免疫系によって自然に生成される突然変異を伴う遺伝子の変異コピーに対応する。
DNAデータストレージでは、トレースはデジタルデータをエンコードするDNA分子のノイズの多いコピーに対応し、エラーはデータ検索プロセスの成果物である。
- 参考スコア(独自算出の注目度): 10.552465253379134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of reconstructing a string from its error-prone copies, the trace
reconstruction problem, was introduced by Vladimir Levenshtein two decades ago.
While there has been considerable theoretical work on trace reconstruction,
practical solutions have only recently started to emerge in the context of two
rapidly developing research areas: immunogenomics and DNA data storage. In
immunogenomics, traces correspond to mutated copies of genes, with mutations
generated naturally by the adaptive immune system. In DNA data storage, traces
correspond to noisy copies of DNA molecules that encode digital data, with
errors being artifacts of the data retrieval process. In this paper, we
introduce several new trace generation models and open questions relevant to
trace reconstruction for immunogenomics and DNA data storage, survey
theoretical results on trace reconstruction, and highlight their connections to
computational biology. Throughout, we discuss the applicability and
shortcomings of known solutions and suggest future research directions.
- Abstract(参考訳): エラーが発生しやすいコピーから文字列を再構築する問題、トレース復元問題(trace reconstruction problem)は20年前にウラジーミル・レベンシュテイン(vladimir levenshtein)によって導入された。
痕跡の復元に関する理論的な研究は盛んに行われてきたが、実際的な解決策は、急速に発展している2つの研究分野、すなわち免疫ゲノム学とDNAデータストレージの文脈でのみ現れ始めている。
免疫ゲノム学において、トレースは、適応免疫系によって自然に生成される突然変異を伴う遺伝子の変異コピーに対応する。
DNAデータストレージでは、トレースはデジタルデータをエンコードするDNA分子のノイズの多いコピーに対応し、エラーはデータ検索プロセスの成果物である。
本稿では,いくつかの新しいトレース生成モデルと,免疫遺伝学とdnaデータ保存のトレース再構成に関する疑問,トレース再構成に関する理論的結果,およびそれらの計算生物学との関連について紹介する。
総合的に,既知のソリューションの適用可能性と欠点を議論し,今後の研究の方向性を提案する。
関連論文リスト
- Cell reprogramming design by transfer learning of functional
transcriptional networks [0.0]
我々は,ヒト細胞運命に関連する転写学的データに基づいて事前学習した細胞行動を制御するための転写学習手法を開発した。
本研究では, 発達関連性の低下に伴い, ある運命から別の運命へと進むために必要な遺伝子摂動の数が増加することを示す。
論文 参考訳(メタデータ) (2024-03-07T19:00:02Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Implicit Neural Multiple Description for DNA-based data storage [6.423239719448169]
DNAは、ストレージ密度と長期的な安定性のために、データストレージソリューションとして大きな可能性を秘めている。
しかし、この新素材の開発には、特に貯蔵や生物学的操作によるエラーに対処する上で、独自の課題が伴う。
我々は,DNAデータ記憶にニューラルネットワークを利用する,新しい圧縮手法と最先端の多重記述符号化(MDC)技術を開発した。
論文 参考訳(メタデータ) (2023-09-13T13:42:52Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - DNAGPT: A Generalized Pre-trained Tool for Versatile DNA Sequence
Analysis Tasks [14.931476374660944]
DNAGPTは、全哺乳類から200億以上の塩基対をトレーニングした、一般的なDNA事前学習モデルである。
古典的なGPTモデルをバイナリ分類タスク、数値回帰タスク、包括的トークン言語で拡張することにより、DNAGPTは汎用的なDNA解析タスクを処理できる。
論文 参考訳(メタデータ) (2023-07-11T06:30:43Z) - Efficient Automation of Neural Network Design: A Survey on
Differentiable Neural Architecture Search [70.31239620427526]
微分可能なニューラルネットワーク探索(DNAS)は、ディープニューラルネットワークアーキテクチャの発見を自動化するトレンドのアプローチとして、急速に自らを強制した。
この増加は主に、最初の主要なDNAS法の一つであるDARTSの人気が原因である。
本総説では,DNASに特に焦点をあて,最近のアプローチを概観する。
論文 参考訳(メタデータ) (2023-04-11T13:15:29Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - Expectile Neural Networks for Genetic Data Analysis of Complex Diseases [3.0088453915399747]
本研究では、複雑な疾患の遺伝子データ解析のための予測型ニューラルネットワーク(ENN)法を開発した。
期待回帰と同様に、ERNは遺伝子変異と疾患の表現型との関係を包括的に把握する。
提案手法は,遺伝子変異と疾患表現型との間に複雑な関係がある場合,既存の予測回帰よりも優れていた。
論文 参考訳(メタデータ) (2020-10-26T21:07:40Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。