論文の概要: Rethinking Performance Measures of RNA Secondary Structure Problems
- arxiv url: http://arxiv.org/abs/2401.05351v1
- Date: Mon, 4 Dec 2023 08:46:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 09:11:27.291053
- Title: Rethinking Performance Measures of RNA Secondary Structure Problems
- Title(参考訳): RNA二次構造問題における性能対策の再考
- Authors: Frederic Runge, J\"org K. H. Franke, Daniel Fertmann, Frank Hutter
- Abstract要約: 深層学習法は、擬似ノットや多相互作用ベースペアのような複雑な特徴を予測することによって、従来のアルゴリズムを超越した。
代替計量としてWeisfeiler-Lehmanグラフカーネル(WL)を提案する。
- 参考スコア(独自算出の注目度): 42.25267871026153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate RNA secondary structure prediction is vital for understanding
cellular regulation and disease mechanisms. Deep learning (DL) methods have
surpassed traditional algorithms by predicting complex features like
pseudoknots and multi-interacting base pairs. However, traditional distance
measures can hardly deal with such tertiary interactions and the currently used
evaluation measures (F1 score, MCC) have limitations. We propose the
Weisfeiler-Lehman graph kernel (WL) as an alternative metric. Embracing
graph-based metrics like WL enables fair and accurate evaluation of RNA
structure prediction algorithms. Further, WL provides informative guidance, as
demonstrated in an RNA design experiment.
- Abstract(参考訳): 正確なRNA二次構造予測は、細胞制御と疾患機構を理解するのに不可欠である。
深層学習(DL)法は、擬似ノットや多相互作用ベースペアのような複雑な特徴を予測することによって、従来のアルゴリズムを超越した。
しかし、従来の距離測度はこのような第三次相互作用にほとんど対応できず、現在使われている評価測度(F1スコア、MCC)には限界がある。
代替計量としてWeisfeiler-Lehmanグラフカーネル(WL)を提案する。
WLのようなグラフベースのメトリクスを採用することで、RNA構造予測アルゴリズムの公平かつ正確な評価が可能になる。
さらに、WLはRNA設計実験で実証された情報的ガイダンスを提供する。
関連論文リスト
- Comprehensive benchmarking of large language models for RNA secondary structure prediction [0.0]
RNA-LLMはRNA配列の大規模なデータセットを使用して、自己教師付き方法で、意味的に豊かな数値ベクトルで各RNA塩基をどう表現するかを学ぶ。
その中で、二次構造を予測することは、RNAの機能的機構を明らかにするための基本的な課題である。
本稿では,いくつかの事前学習されたRNA-LLMの総合的な実験解析を行い,それらを統合されたディープラーニングフレームワークにおけるRNA二次構造予測タスクと比較する。
論文 参考訳(メタデータ) (2024-10-21T17:12:06Z) - Predicting Distance matrix with large language models [1.8855270809505869]
データ制限のため、RNA構造予測は依然として重要な課題である。
核磁気共鳴分光法、X線結晶学、電子顕微鏡などの従来の手法は高価で時間を要する。
距離マップはヌクレオチド間の空間的制約を単純化し、完全な3Dモデルを必要としない本質的な関係を捉える。
論文 参考訳(メタデータ) (2024-09-24T10:28:55Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Splicing Up Your Predictions with RNA Contrastive Learning [4.35360799431127]
我々は、代替スプライシング遺伝子複製によって生成された機能配列間の類似性を利用して、対照的な学習手法をゲノムデータに拡張する。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
学習された潜在空間の探索は、我々の対照的な目的が意味論的に意味のある表現をもたらすことを示した。
論文 参考訳(メタデータ) (2023-10-12T21:51:25Z) - Deciphering RNA Secondary Structure Prediction: A Probabilistic K-Rook Matching Perspective [63.3632827588974]
RFoldは、与えられたシーケンスから最もよく一致するK-Rook解を予測する方法である。
RFoldは、最先端のアプローチよりも競争性能とおよそ8倍の推論効率を達成する。
論文 参考訳(メタデータ) (2022-12-02T16:34:56Z) - E2Efold-3D: End-to-End Deep Learning Method for accurate de novo RNA 3D
Structure Prediction [46.38735421190187]
E2Efold-3Dというエンド・ツー・エンドの深層学習手法を開発し,テクスタイド・ノボRNA構造予測を精度良く行う。
完全微分可能なエンドツーエンドパイプライン、二次構造による自己蒸留、パラメータ効率のよいバックボーンの定式化など、データ不足を克服するために、いくつかの新しいコンポーネントが提案されている。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Computational prediction of RNA tertiary structures using machine
learning methods [14.35527588241679]
計算予測アプローチはRNA構造とその安定化因子を理解するのに役立つ。
タンパク質関連分野におけるそれらの利用の歴史は長いが、RNA第3次構造を予測する機械学習手法は新しくて稀である。
論文 参考訳(メタデータ) (2020-09-03T04:01:43Z) - Review of Machine-Learning Methods for RNA Secondary Structure
Prediction [21.3539253580504]
機械学習技術に基づくRNA二次構造予測手法の概要について概説する。
RNA二次構造予測の分野で現在進行中の課題と今後の動向についても論じる。
論文 参考訳(メタデータ) (2020-09-01T03:17:15Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - RNA Secondary Structure Prediction By Learning Unrolled Algorithms [70.09461537906319]
本稿では,RNA二次構造予測のためのエンド・ツー・エンドのディープラーニングモデルであるE2Efoldを提案する。
E2Efoldの鍵となる考え方は、RNA塩基対行列を直接予測し、制約のないプログラミングを、制約を強制するための深いアーキテクチャのテンプレートとして使うことである。
ベンチマークデータセットに関する包括的な実験により、E2Efoldの優れた性能を実証する。
論文 参考訳(メタデータ) (2020-02-13T23:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。