論文の概要: Ranking labs-of-origin for genetically engineered DNA using Metric
Learning
- arxiv url: http://arxiv.org/abs/2107.07878v1
- Date: Fri, 16 Jul 2021 13:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-19 18:45:54.111035
- Title: Ranking labs-of-origin for genetically engineered DNA using Metric
Learning
- Title(参考訳): Metric Learning を用いた遺伝子組み換えDNAの分類
- Authors: I. Muniz, F. H. F. Camargo and A. Marques
- Abstract要約: 提案手法は,DNAシークエンスや実験室の組込みに最も可能性の高い実験室をランク付けし,組込みを生成する方法である。
これらの埋め込みは、DNA配列とラボの両方をクラスタリングするなど、他にもさまざまなタスクを実行することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the constant advancements of genetic engineering, a common concern is to
be able to identify the lab-of-origin of genetically engineered DNA sequences.
For that reason, AltLabs has hosted the genetic Engineering Attribution
Challenge to gather many teams to propose new tools to solve this problem. Here
we show our proposed method to rank the most likely labs-of-origin and generate
embeddings for DNA sequences and labs. These embeddings can also perform
various other tasks, like clustering both DNA sequences and labs and using them
as features for Machine Learning models applied to solve other problems. This
work demonstrates that our method outperforms the classic training method for
this task while generating other helpful information.
- Abstract(参考訳): 遺伝子工学の絶え間ない進歩により、共通の関心事は遺伝子組み換えDNAシークエンスを同定できることである。
そのため、AltLabsは遺伝子工学属性チャレンジを開催し、多くのチームを集めてこの問題を解決する新しいツールを提案している。
ここでは、最も可能性の高い実験室をランク付けし、DNA配列と実験室の埋め込みを生成する方法を示す。
これらの埋め込みは、DNA配列とラボの両方をクラスタリングしたり、他の問題を解決するために機械学習モデルの機能として使用するなど、さまざまなタスクを実行することもできる。
本研究は,本手法が他の有用な情報を生成しつつ,従来の学習方法よりも優れていることを示す。
関連論文リスト
- BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.35697293789605]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - HyenaDNA: Long-Range Genomic Sequence Modeling at Single Nucleotide
Resolution [76.97231739317259]
本稿では,ヒト参照ゲノム上に,最大100万個のトークンを単一ヌクレオチドレベルで有するゲノム基盤モデルであるHyenaDNAについて紹介する。
Nucleotide Transformerの微調整されたベンチマークでは、HyenaDNAが18のデータセットのうち12の最先端(SotA)に到達した。
論文 参考訳(メタデータ) (2023-06-27T20:46:34Z) - Learning to Untangle Genome Assembly with Graph Convolutional Networks [17.227634756670835]
我々は,グラフ畳み込みネットワークをトレーニングし,それらを経由する正しい経路を見つけることによって,アセンブリグラフを解決するための新しい学習フレームワークを導入する。
実験の結果、単一の染色体からのみ生成された模擬グラフに基づいて訓練されたモデルが、他の全ての染色体を著しく解決できることがわかった。
論文 参考訳(メタデータ) (2022-06-01T04:14:25Z) - GENEOnet: A new machine learning paradigm based on Group Equivariant
Non-Expansive Operators. An application to protein pocket detection [97.5153823429076]
グループ同変非拡張演算子に基づく新しい計算パラダイムを導入する。
我々は、薬物設計における重要な問題として、ホスト可能なタンパク質の表面のポケットを検出する、GENEOnetと呼ばれる方法を試した。
論文 参考訳(メタデータ) (2022-01-31T11:14:51Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Efficient approximation of DNA hybridisation using deep learning [0.0]
本研究は,DNAハイブリダイゼーションの予測に応用された機械学習手法の総合的研究である。
機械学習アルゴリズムの広い範囲の使用を可能にする2.5百万以上のデータポイントの合成ハイブリッド化データセットを紹介します。
論文 参考訳(メタデータ) (2021-02-19T19:23:49Z) - A deep learning classifier for local ancestry inference [63.8376359764052]
局所祖先推論は、個人のゲノムの各セグメントの祖先を特定する。
我々は,エンコーダ・デコーダアーキテクチャを備えた深層畳み込みニューラルネットワークを用いた新しいLAIツールを開発した。
我々は,既存のゴールド標準ツール RFMix とほぼ同等の精度で,ゼロショットタスクとしてアドミキシングを学習できることを実証した。
論文 参考訳(メタデータ) (2020-11-04T00:42:01Z) - Comparing Machine Learning Algorithms with or without Feature Extraction
for DNA Classification [0.7742297876120561]
3つの最先端アルゴリズム、すなわち、畳み込みニューラルネットワーク、ディープニューラルネットワーク、N-gram確率モデルがDNA分類のタスクに使用される。
本稿では,レベンシュテイン距離とランダムに生成されたDNAサブ配列に基づく特徴抽出手法を提案する。
Covid-19、AIDS、インフルエンザ、C型肝炎などのウイルス性疾患に関する4つのデータセットが、それぞれ異なるアプローチを評価するために使用される。
論文 参考訳(メタデータ) (2020-11-01T12:04:54Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。