論文の概要: RNA Alternative Splicing Prediction with Discrete Compositional Energy
Network
- arxiv url: http://arxiv.org/abs/2103.04246v1
- Date: Sun, 7 Mar 2021 03:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 07:31:20.754898
- Title: RNA Alternative Splicing Prediction with Discrete Compositional Energy
Network
- Title(参考訳): 離散構成エネルギーネットワークを用いたRNA代替スプライシング予測
- Authors: Alvin Chan, Anna Korsakova, Yew-Soon Ong, Fernaldo Richtia Winnerdy,
Kah Wai Lim, Anh Tuan Phan
- Abstract要約: 回帰タスクとしてのRNAスプライシングの予測を定式化し、学習モデルのベンチマークのための新しいトレーニングデータセット(CAPD)を構築する。
本研究では,スプライスサイト,ジャンクション,転写の階層的関係を利用した離散構成エネルギーネットワーク(DCEN)を提案する。
代替スプライシング予測の場合、DCENはその構成スプライス接合のエネルギー値を通じてmRNA転写確率をモデル化する。
- 参考スコア(独自算出の注目度): 21.032529696347073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A single gene can encode for different protein versions through a process
called alternative splicing. Since proteins play major roles in cellular
functions, aberrant splicing profiles can result in a variety of diseases,
including cancers. Alternative splicing is determined by the gene's primary
sequence and other regulatory factors such as RNA-binding protein levels. With
these as input, we formulate the prediction of RNA splicing as a regression
task and build a new training dataset (CAPD) to benchmark learned models. We
propose discrete compositional energy network (DCEN) which leverages the
hierarchical relationships between splice sites, junctions and transcripts to
approach this task. In the case of alternative splicing prediction, DCEN models
mRNA transcript probabilities through its constituent splice junctions' energy
values. These transcript probabilities are subsequently mapped to relative
abundance values of key nucleotides and trained with ground-truth experimental
measurements. Through our experiments on CAPD, we show that DCEN outperforms
baselines and ablation variants.
- Abstract(参考訳): 単一の遺伝子は、代替スプライシングと呼ばれるプロセスを通じて、異なるタンパク質バージョンをコードすることができる。
タンパク質は細胞機能において主要な役割を果たすため、異常なスプライシングプロファイルはがんを含む様々な疾患を引き起こす可能性がある。
代替スプライシングは、遺伝子の一次配列およびRNA結合タンパク質レベルなどの他の調節因子によって決定される。
これを入力として、RNAスプライシングの予測を回帰タスクとして定式化し、学習モデルをベンチマークするための新しいトレーニングデータセット(CAPD)を構築します。
本研究では,スプライスサイト,接合部,転写部間の階層的関係を利用した離散構成エネルギーネットワーク(DCEN)を提案する。
代替スプライシング予測の場合、DCENはその構成スプライス接合のエネルギー値を通じてmRNA転写確率をモデル化する。
これらの転写確率はその後、キーヌクレオチドの相対的存在量値にマッピングされ、基礎実験によって訓練される。
CAPDの実験を通じて、DCENがベースラインとアブレーションバリアントを上回っていることを示します。
関連論文リスト
- Gene Regulatory Network Inference from Pre-trained Single-Cell Transcriptomics Transformer with Joint Graph Learning [10.44434676119443]
単一細胞RNAシークエンシング(scRNA-seq)データから遺伝子制御ネットワーク(GRN)を推定することは複雑である。
本研究では,単一セルBERTを用いた事前学習型トランスモデル(scBERT)を活用することで,この問題に対処する。
本稿では,単一セル言語モデルによって学習されたリッチな文脈表現と,GRNで符号化された構造化知識を組み合わせた,新しい共同グラフ学習手法を提案する。
論文 参考訳(メタデータ) (2024-07-25T16:42:08Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Splicing Up Your Predictions with RNA Contrastive Learning [4.35360799431127]
我々は、代替スプライシング遺伝子複製によって生成された機能配列間の類似性を利用して、対照的な学習手法をゲノムデータに拡張する。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
学習された潜在空間の探索は、我々の対照的な目的が意味論的に意味のある表現をもたらすことを示した。
論文 参考訳(メタデータ) (2023-10-12T21:51:25Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Top-N: Equivariant set and graph generation without exchangeability [61.24699600833916]
集合やグラフ上の分布の前にベクトル形状をマッピングするワンショット確率デコーダを考える。
これらの機能は、可変オートエンコーダ(VAE)、生成逆数ネットワーク(GAN)、正規化フローに統合することができる。
Top-nは、トレーニング可能な参照セットから最も関連性の高いポイントを選択することを学ぶ、決定論的で非交換可能なセット生成メカニズムである。
論文 参考訳(メタデータ) (2021-10-05T14:51:19Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。