論文の概要: CapsProm: A Capsule Network For Promoter Prediction
- arxiv url: http://arxiv.org/abs/2112.03710v1
- Date: Tue, 7 Dec 2021 14:03:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 19:32:51.997056
- Title: CapsProm: A Capsule Network For Promoter Prediction
- Title(参考訳): CapsProm:プロモーター予測のためのカプセルネットワーク
- Authors: Lauro Moraes and Pedro Silva and Eduardo Luz and Gladston Moreira
- Abstract要約: そこで本研究では,DNAのプロモーター配列を正確に同定し,カプセルネットワークに基づく汎用アーキテクチャを提案する。
私たちのモデルであるCapsPromは、生物間の学習の伝達を支援し、その適用性を高めることができます。
- 参考スコア(独自算出の注目度): 0.7411430445517118
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Locating the promoter region in DNA sequences is of paramount importance in
the field of bioinformatics. This is a problem widely studied in the
literature, however, not yet fully resolved. Some researchers have presented
remarkable results using convolution networks, that allowed the automatic
extraction of features from a DNA chain. However, a universal architecture that
could generalize to several organisms has not yet been achieved, and thus,
requiring researchers to seek new architectures and hyperparameters for each
new organism evaluated. In this work, we propose a versatile architecture,
based on capsule network, that can accurately identify promoter sequences in
raw DNA data from seven different organisms, eukaryotic, and prokaryotic. Our
model, the CapsProm, could assist in the transfer of learning between organisms
and expand its applicability. Furthermore the CapsProm showed competitive
results, overcoming the baseline method in five out of seven of the tested
datasets (F1-score). The models and source code are made available at
https://github.com/lauromoraes/CapsNet-promoter.
- Abstract(参考訳): DNA配列におけるプロモーター領域の配置は、バイオインフォマティクスの分野において最も重要である。
これは文献で広く研究されている問題であるが、まだ完全には解決されていない。
一部の研究者は、DNA鎖から特徴を自動抽出できる畳み込みネットワークを用いて顕著な結果を示した。
しかし、いくつかの生物に一般化できる普遍的なアーキテクチャはまだ達成されておらず、研究者が新しい生物の評価ごとに新しいアーキテクチャとハイパーパラメータを求める必要がある。
本研究では,7種の異なる生物,真核生物,および原核生物の生DNAデータのプロモーター配列を正確に同定できるカプセルネットワークに基づく多用途アーキテクチャを提案する。
われわれのモデルであるCapsPromは、生物間の学習の伝達を支援し、適用性を高める。
さらに、CapsPromは7つのテストデータセット(F1スコア)のうち5つでベースラインメソッドを克服し、競争結果を示した。
モデルとソースコードはhttps://github.com/lauromoraes/capsnet-promoterで入手できる。
関連論文リスト
- A mechanistically interpretable neural network for regulatory genomics [0.6224769485481241]
このアーキテクチャはde novoモチーフの発見とモチーフのインスタンス呼び出しに優れており、可変シーケンスコンテキストに対して堅牢であり、新しい関数シーケンスを完全解釈可能な生成を可能にする。
論文 参考訳(メタデータ) (2024-10-08T17:15:26Z) - A Benchmark Dataset for Multimodal Prediction of Enzymatic Function Coupling DNA Sequences and Natural Language [3.384797724820242]
DNA配列から遺伝子機能を予測することは、生物学における根本的な課題である。
深層学習モデルは、DNA配列を埋め込み、その酵素機能を予測するために提案されている。
科学界の生物学的機能に関する知識の多くは分類学的なラベルで表されていない。
論文 参考訳(メタデータ) (2024-07-21T19:27:43Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - BEND: Benchmarking DNA Language Models on biologically meaningful tasks [7.005668635562045]
DNA言語モデルのベンチマークであるBENDを紹介し、現実的で生物学的に意味のある下流タスクのコレクションを特徴とする。
現在のDNA LMからの埋め込みは、一部のタスクにおいて専門家メソッドのパフォーマンスにアプローチできるが、長距離機能に関する限られた情報しか取得できない。
論文 参考訳(メタデータ) (2023-11-21T12:34:00Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Efficient Automation of Neural Network Design: A Survey on
Differentiable Neural Architecture Search [70.31239620427526]
微分可能なニューラルネットワーク探索(DNAS)は、ディープニューラルネットワークアーキテクチャの発見を自動化するトレンドのアプローチとして、急速に自らを強制した。
この増加は主に、最初の主要なDNAS法の一つであるDARTSの人気が原因である。
本総説では,DNASに特に焦点をあて,最近のアプローチを概観する。
論文 参考訳(メタデータ) (2023-04-11T13:15:29Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Bacteriophage classification for assembled contigs using Graph
Convolutional Network [0.0]
細菌ファージ(別名食虫)は微生物の生物学において重要な役割を担っている。
高い多様性、豊富な量、限られた食餌は、分類学的分析に大きな課題をもたらす。
我々は、ファージの分類分類を行うために、PhaGCNという新しい半教師付き学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-07T08:58:35Z) - Comparisons among different stochastic selection of activation layers
for convolutional neural networks for healthcare [77.99636165307996]
ニューラルネットワークのアンサンブルを用いて生体医用画像の分類を行う。
ReLU, leaky ReLU, Parametric ReLU, ELU, Adaptive Piecewice Linear Unit, S-Shaped ReLU, Swish, Mish, Mexican Linear Unit, Parametric Deformable Linear Unit, Soft Root Sign。
論文 参考訳(メタデータ) (2020-11-24T01:53:39Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。