論文の概要: BASiNETEntropy: an alignment-free method for classification of
biological sequences through complex networks and entropy maximization
- arxiv url: http://arxiv.org/abs/2203.15635v1
- Date: Thu, 24 Mar 2022 14:19:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-03 18:28:31.300083
- Title: BASiNETEntropy: an alignment-free method for classification of
biological sequences through complex networks and entropy maximization
- Title(参考訳): BASiNETEntropy:複雑なネットワークとエントロピー最大化による生物学的配列のアライメントのない分類法
- Authors: Murilo Montanini Breve, Matheus Henrique Pimenta-Zanon and Fabr\'icio
Martins Lopes
- Abstract要約: 本研究は, 複雑なネットワークとエントロピーによる生物配列の分類法を提案する。
最大エントロピー原理は、RNAクラスに関する最も情報性の高いエッジを同定し、フィルターされた複雑なネットワークを生成するために提案される。
提案手法は13種の異なるRNAクラスの分類において評価された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The discovery of nucleic acids and the structure of DNA have brought
considerable advances in the understanding of life. The development of
next-generation sequencing technologies has led to a large-scale generation of
data, for which computational methods have become essential for analysis and
knowledge discovery. In particular, RNAs have received much attention because
of the diversity of their functionalities in the organism and the discoveries
of different classes with different functions in many biological processes.
Therefore, the correct identification of RNA sequences is increasingly
important to provide relevant information to understand the functioning of
organisms. This work addresses this context by presenting a new method for the
classification of biological sequences through complex networks and entropy
maximization. The maximum entropy principle is proposed to identify the most
informative edges about the RNA class, generating a filtered complex network.
The proposed method was evaluated in the classification of different RNA
classes from 13 species. The proposed method was compared to PLEK, CPC2 and
BASiNET methods, outperforming all compared methods. BASiNETEntropy classified
all RNA sequences with high accuracy and low standard deviation in results,
showing assertiveness and robustness. The proposed method is implemented in an
open source in R language and is freely available at
https://cran.r-project.org/web/packages/BASiNETEntropy.
- Abstract(参考訳): 核酸の発見とDNAの構造は、生命の理解に大きな進歩をもたらした。
次世代シークエンシング技術の発展は、解析や知識発見に計算手法が不可欠になっている大規模なデータ生成につながっている。
特にRNAは、生物の機能の多様性と、多くの生物学的プロセスにおいて異なる機能を持つ異なるクラスの発見により、多くの注目を集めている。
したがって、RNA配列の正確な同定は、生物の機能を理解するための関連情報を提供するためにますます重要である。
この研究は、複雑なネットワークとエントロピーの最大化を通じて生物学的配列を分類するための新しい方法を提示し、この文脈に対処する。
最大エントロピー原理は、RNAクラスに関する最も情報性の高いエッジを同定し、フィルターされた複雑なネットワークを生成するために提案される。
提案手法は13種の異なるRNAクラスの分類において評価された。
提案手法をPLEK, CPC2, BASiNET法と比較し, 比較した手法を全て比較した。
BASiNETEntropyは、全てのRNA配列を高い精度と低標準偏差で分類し、断定性と堅牢性を示した。
提案手法はオープンソースのR言語で実装されており、https://cran.r-project.org/web/packages/BASiNETEntropyで自由に利用できる。
関連論文リスト
- Character-level Tokenizations as Powerful Inductive Biases for RNA Foundational Models [0.0]
RNAの挙動を理解し予測することは、RNAの構造と相互作用の複雑さのために困難である。
現在のRNAモデルは、タンパク質ドメインで観測された性能とはまだ一致していない。
ChaRNABERTは、確立されたベンチマークでいくつかのタスクで最先端のパフォーマンスに到達することができる。
論文 参考訳(メタデータ) (2024-11-05T21:56:16Z) - RNACG: A Universal RNA Sequence Conditional Generation model based on Flow-Matching [0.0]
本研究では,フローマッチング,すなわちRNACGに基づく普遍的なRNA配列生成モデルを開発する。
RNACGは様々な条件入力に対応でき、可搬性があり、ユーザーは条件入力のために符号化ネットワークをカスタマイズできる。
RNACGは、シーケンス生成およびプロパティ予測タスクに広範な適用性を示す。
論文 参考訳(メタデータ) (2024-07-29T09:46:46Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - RNA Secondary Structure Prediction Using Transformer-Based Deep Learning Models [13.781096813376145]
ヒトゲノムプロジェクト(Human Genome Project)は、生体分子の配列、構造、機能に関連するデータの指数関数的な増加につながった。
本稿では、RNAの基本概念、RNA二次構造、その予測について論じる。
生体高分子の構造予測における機械学習技術の応用について検討した。
論文 参考訳(メタデータ) (2024-04-14T08:36:14Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Knowledge from Large-Scale Protein Contact Prediction Models Can Be
Transferred to the Data-Scarce RNA Contact Prediction Task [40.051834115537474]
タンパク質共進化トランスフォーマーに基づくディープニューラルネットワークはRNA接触予測タスクに転送可能である。
実験により、転写学習によるRNA接触予測が大幅に改善されることが確認された。
以上の結果から, タンパク質の構造パターンはRNAに転移し, 新たな研究の道を開く可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-13T06:00:56Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z) - Approximate kNN Classification for Biomedical Data [1.1852406625172218]
Single-cell RNA-seq (scRNA-seq) は、将来性はあるが重要な計算課題を持つDNAシークエンシング技術である。
scRNA-seqデータにおけるkNN分類のタスクに近似した近接探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-03T18:30:43Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。