論文の概要: RNA Alternative Splicing Prediction with Discrete Compositional Energy
Network
- arxiv url: http://arxiv.org/abs/2103.04246v1
- Date: Sun, 7 Mar 2021 03:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 07:31:20.754898
- Title: RNA Alternative Splicing Prediction with Discrete Compositional Energy
Network
- Title(参考訳): 離散構成エネルギーネットワークを用いたRNA代替スプライシング予測
- Authors: Alvin Chan, Anna Korsakova, Yew-Soon Ong, Fernaldo Richtia Winnerdy,
Kah Wai Lim, Anh Tuan Phan
- Abstract要約: 回帰タスクとしてのRNAスプライシングの予測を定式化し、学習モデルのベンチマークのための新しいトレーニングデータセット(CAPD)を構築する。
本研究では,スプライスサイト,ジャンクション,転写の階層的関係を利用した離散構成エネルギーネットワーク(DCEN)を提案する。
代替スプライシング予測の場合、DCENはその構成スプライス接合のエネルギー値を通じてmRNA転写確率をモデル化する。
- 参考スコア(独自算出の注目度): 21.032529696347073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A single gene can encode for different protein versions through a process
called alternative splicing. Since proteins play major roles in cellular
functions, aberrant splicing profiles can result in a variety of diseases,
including cancers. Alternative splicing is determined by the gene's primary
sequence and other regulatory factors such as RNA-binding protein levels. With
these as input, we formulate the prediction of RNA splicing as a regression
task and build a new training dataset (CAPD) to benchmark learned models. We
propose discrete compositional energy network (DCEN) which leverages the
hierarchical relationships between splice sites, junctions and transcripts to
approach this task. In the case of alternative splicing prediction, DCEN models
mRNA transcript probabilities through its constituent splice junctions' energy
values. These transcript probabilities are subsequently mapped to relative
abundance values of key nucleotides and trained with ground-truth experimental
measurements. Through our experiments on CAPD, we show that DCEN outperforms
baselines and ablation variants.
- Abstract(参考訳): 単一の遺伝子は、代替スプライシングと呼ばれるプロセスを通じて、異なるタンパク質バージョンをコードすることができる。
タンパク質は細胞機能において主要な役割を果たすため、異常なスプライシングプロファイルはがんを含む様々な疾患を引き起こす可能性がある。
代替スプライシングは、遺伝子の一次配列およびRNA結合タンパク質レベルなどの他の調節因子によって決定される。
これを入力として、RNAスプライシングの予測を回帰タスクとして定式化し、学習モデルをベンチマークするための新しいトレーニングデータセット(CAPD)を構築します。
本研究では,スプライスサイト,接合部,転写部間の階層的関係を利用した離散構成エネルギーネットワーク(DCEN)を提案する。
代替スプライシング予測の場合、DCENはその構成スプライス接合のエネルギー値を通じてmRNA転写確率をモデル化する。
これらの転写確率はその後、キーヌクレオチドの相対的存在量値にマッピングされ、基礎実験によって訓練される。
CAPDの実験を通じて、DCENがベースラインとアブレーションバリアントを上回っていることを示します。
関連論文リスト
- Splicing Up Your Predictions with RNA Contrastive Learning [4.35360799431127]
我々は、代替スプライシング遺伝子複製によって生成された機能配列間の類似性を利用して、対照的な学習手法をゲノムデータに拡張する。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
学習された潜在空間の探索は、我々の対照的な目的が意味論的に意味のある表現をもたらすことを示した。
論文 参考訳(メタデータ) (2023-10-12T21:51:25Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - Knowledge from Large-Scale Protein Contact Prediction Models Can Be
Transferred to the Data-Scarce RNA Contact Prediction Task [40.051834115537474]
タンパク質共進化トランスフォーマーに基づくディープニューラルネットワークはRNA接触予測タスクに転送可能である。
実験により、転写学習によるRNA接触予測が大幅に改善されることが確認された。
以上の結果から, タンパク質の構造パターンはRNAに転移し, 新たな研究の道を開く可能性が示唆された。
論文 参考訳(メタデータ) (2023-02-13T06:00:56Z) - Bayesian Reconstruction and Differential Testing of Excised mRNA [0.0]
我々は、転写と局所スプライシングの視点を調和させる最初の確率モデルを開発する。
拡張mRNA(BREM)の再構成のための新しい階層的ベイズ混和モデルを提案する。
BREMは局所スプライシングイベントとフル長の転写産物を補間し、高い後部確率を持つ中小企業にのみ焦点をあてる。
論文 参考訳(メタデータ) (2022-11-14T04:46:33Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Top-N: Equivariant set and graph generation without exchangeability [61.24699600833916]
集合やグラフ上の分布の前にベクトル形状をマッピングするワンショット確率デコーダを考える。
これらの機能は、可変オートエンコーダ(VAE)、生成逆数ネットワーク(GAN)、正規化フローに統合することができる。
Top-nは、トレーニング可能な参照セットから最も関連性の高いポイントを選択することを学ぶ、決定論的で非交換可能なセット生成メカニズムである。
論文 参考訳(メタデータ) (2021-10-05T14:51:19Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。