論文の概要: Splicing Up Your Predictions with RNA Contrastive Learning
- arxiv url: http://arxiv.org/abs/2310.08738v2
- Date: Tue, 17 Oct 2023 13:50:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 20:09:11.821926
- Title: Splicing Up Your Predictions with RNA Contrastive Learning
- Title(参考訳): RNAコントラスト学習で予測をスプリシングする
- Authors: Philip Fradkin, Ruian Shi, Bo Wang, Brendan Frey, Leo J. Lee
- Abstract要約: 我々は、代替スプライシング遺伝子複製によって生成された機能配列間の類似性を利用して、対照的な学習手法をゲノムデータに拡張する。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
学習された潜在空間の探索は、我々の対照的な目的が意味論的に意味のある表現をもたらすことを示した。
- 参考スコア(独自算出の注目度): 4.35360799431127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the face of rapidly accumulating genomic data, our understanding of the
RNA regulatory code remains incomplete. Recent self-supervised methods in other
domains have demonstrated the ability to learn rules underlying the
data-generating process such as sentence structure in language. Inspired by
this, we extend contrastive learning techniques to genomic data by utilizing
functional similarities between sequences generated through alternative
splicing and gene duplication. Our novel dataset and contrastive objective
enable the learning of generalized RNA isoform representations. We validate
their utility on downstream tasks such as RNA half-life and mean ribosome load
prediction. Our pre-training strategy yields competitive results using linear
probing on both tasks, along with up to a two-fold increase in Pearson
correlation in low-data conditions. Importantly, our exploration of the learned
latent space reveals that our contrastive objective yields semantically
meaningful representations, underscoring its potential as a valuable
initialization technique for RNA property prediction.
- Abstract(参考訳): ゲノムデータの急激な蓄積に直面して、RNA制御コードの理解はいまだに不完全である。
近年、他の領域における自己教師あり手法は、言語における文構造のようなデータ生成プロセスの基礎となるルールを学習する能力を示している。
そこで本研究では,交互スプライシングと遺伝子重複によって生成された配列間の機能的類似性を利用して,ゲノムデータとの対比学習技術を拡張した。
我々の新しいデータセットと対照的な目的は、一般化されたRNAアイソフォーム表現の学習を可能にする。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
事前学習戦略は,両タスクにおける線形プローブを用いた競争結果と,低データ条件におけるピアソン相関の最大2倍の増大をもたらす。
重要なことは、学習された潜伏空間を探索することで、我々の対照的な目的が意味的に意味のある表現をもたらし、RNA特性予測の貴重な初期化技術としての可能性を示している。
関連論文リスト
- Knowledge from Large-Scale Protein Contact Prediction Models Can Be
Transferred to the Data-Scarce RNA Contact Prediction Task [40.051834115537474]
タンパク質共進化トランスフォーマーに基づくディープニューラルネットワークはRNA接触予測タスクに転送可能である。
実験により、転写学習によるRNA接触予測が大幅に改善されることが確認された。
以上の結果から, タンパク質の構造パターンはRNAに転移し, 新たな研究の道を開く可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-13T06:00:56Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - E2Efold-3D: End-to-End Deep Learning Method for accurate de novo RNA 3D
Structure Prediction [46.38735421190187]
E2Efold-3Dというエンド・ツー・エンドの深層学習手法を開発し,テクスタイド・ノボRNA構造予測を精度良く行う。
完全微分可能なエンドツーエンドパイプライン、二次構造による自己蒸留、パラメータ効率のよいバックボーンの定式化など、データ不足を克服するために、いくつかの新しいコンポーネントが提案されている。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z) - Probabilistic Transformer: Modelling Ambiguities and Distributions for
RNA Folding and Molecule Design [38.46798525594529]
本稿では,最も成功したディープラーニングモデルの1つであるTransformerを強化するために,階層的な潜在分布を提案する。
本研究は,RNAの折り畳みにおける最先端の成果を生かした合成課題に対するアプローチの利点を示し,その特性に基づく分子設計における生成能力を示す。
論文 参考訳(メタデータ) (2022-05-27T12:11:38Z) - Provable Guarantees for Self-Supervised Deep Learning with Spectral
Contrastive Loss [72.62029620566925]
自己教師型学習の最近の研究は、対照的な学習パラダイムを頼りに、最先端の技術の進歩を遂げている。
我々の研究は、正の対の条件的独立性を仮定することなく、対照的な学習を分析する。
本稿では,人口増分グラフ上でスペクトル分解を行う損失を提案し,コントラスト学習目的として簡潔に記述することができる。
論文 参考訳(メタデータ) (2021-06-08T07:41:02Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Approximate kNN Classification for Biomedical Data [1.1852406625172218]
Single-cell RNA-seq (scRNA-seq) は、将来性はあるが重要な計算課題を持つDNAシークエンシング技術である。
scRNA-seqデータにおけるkNN分類のタスクに近似した近接探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-03T18:30:43Z) - Representation Learning for Sequence Data with Deep Autoencoding
Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。
我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。
提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文 参考訳(メタデータ) (2020-10-07T03:34:01Z) - Review of Machine-Learning Methods for RNA Secondary Structure
Prediction [21.3539253580504]
機械学習技術に基づくRNA二次構造予測手法の概要について概説する。
RNA二次構造予測の分野で現在進行中の課題と今後の動向についても論じる。
論文 参考訳(メタデータ) (2020-09-01T03:17:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。