論文の概要: Multimodal Modeling of CRISPR-Cas12 Activity Using Foundation Models and Chromatin Accessibility Data
- arxiv url: http://arxiv.org/abs/2506.11182v1
- Date: Thu, 12 Jun 2025 16:15:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.539351
- Title: Multimodal Modeling of CRISPR-Cas12 Activity Using Foundation Models and Chromatin Accessibility Data
- Title(参考訳): 基礎モデルとクロマチンアクセシビリティデータを用いたCRISPR-Cas12活性のマルチモーダルモデリング
- Authors: Azim Dehghani Amirabad, Yanfei Zhang, Artem Moskalev, Sowmya Rajesh, Tommaso Mansi, Shuwei Li, Mangal Prakash, Rui Liao,
- Abstract要約: 本研究は,転写学的なデータに基づいてトレーニングされた生物基盤モデルにより,gRNAの活性推定が向上するかどうかを考察する。
既存のRNAファンデーションモデルからの埋め込みを軽量回帰器への入力として使用することにより、従来のベースラインよりも大幅に向上することを示す。
本研究は,gRNA活性予測のための事前学習基盤モデルとアクセシビリティーデータの有効性を明らかにする。
- 参考スコア(独自算出の注目度): 5.002699100842828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting guide RNA (gRNA) activity is critical for effective CRISPR-Cas12 genome editing but remains challenging due to limited data, variation across protospacer adjacent motifs (PAMs-short sequence requirements for Cas binding), and reliance on large-scale training. We investigate whether pre-trained biological foundation model originally trained on transcriptomic data can improve gRNA activity estimation even without domain-specific pre-training. Using embeddings from existing RNA foundation model as input to lightweight regressor, we show substantial gains over traditional baselines. We also integrate chromatin accessibility data to capture regulatory context, improving performance further. Our results highlight the effectiveness of pre-trained foundation models and chromatin accessibility data for gRNA activity prediction.
- Abstract(参考訳): ガイドRNA (gRNA) の活性の予測は、CRISPR-Cas12ゲノム編集に重要であるが、限られたデータ、プロトスペーサの隣接モチーフ(Cas結合のPAMs-ショート配列要求)の変動、大規模トレーニングへの依存により、依然として困難である。
本研究は, 当初, 転写学データに基づいて訓練された生物基盤モデルを用いて, ドメイン固有の事前学習を行わなくても, gRNAの活性推定が向上するかどうかを考察する。
既存のRNAファンデーションモデルからの埋め込みを軽量回帰器への入力として使用することにより、従来のベースラインよりも大幅に向上することを示す。
また、クロマチンアクセシビリティーデータを統合して規制コンテキストをキャプチャし、パフォーマンスをさらに向上する。
本結果は,gRNA活性予測のための事前学習基盤モデルとクロマチンアクセシビリティーデータの有効性を強調した。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Character-level Tokenizations as Powerful Inductive Biases for RNA Foundational Models [0.0]
RNAの挙動を理解し予測することは、RNAの構造と相互作用の複雑さのために困難である。
現在のRNAモデルは、タンパク質ドメインで観測された性能とはまだ一致していない。
ChaRNABERTは、確立されたベンチマークでいくつかのタスクで最先端のパフォーマンスに到達することができる。
論文 参考訳(メタデータ) (2024-11-05T21:56:16Z) - DeepFM-Crispr: Prediction of CRISPR On-Target Effects via Deep Learning [0.24554686192257422]
DeepFM-Crisprは、ターゲット上の効率を予測し、Cas13dのターゲット外効果を評価するために開発された新しいディープラーニングモデルである。
大規模な言語モデルを利用して、進化的および構造的なデータに富んだ包括的な表現を生成し、RNA二次構造の予測と全体的なsgRNAの有効性を高める。
論文 参考訳(メタデータ) (2024-09-09T17:33:54Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Splicing Up Your Predictions with RNA Contrastive Learning [4.35360799431127]
我々は、代替スプライシング遺伝子複製によって生成された機能配列間の類似性を利用して、対照的な学習手法をゲノムデータに拡張する。
RNA半減期やリボソーム負荷予測などの下流タスクにおけるそれらの有用性を検証する。
学習された潜在空間の探索は、我々の対照的な目的が意味論的に意味のある表現をもたらすことを示した。
論文 参考訳(メタデータ) (2023-10-12T21:51:25Z) - Scalable Deep Learning for RNA Secondary Structure Prediction [38.46798525594529]
本稿では,アキシャルアテンションとリサイクリングを用いた学習モデルであるRNAformerについて述べる。
提案手法は,一般的なTS0ベンチマークデータセット上での最先端性能を実現する。
RNAフォーマがRNA折り畳み過程の生体物理モデルを学ぶことができることを示す。
論文 参考訳(メタデータ) (2023-07-14T12:54:56Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.193512039121984]
RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文 参考訳(メタデータ) (2022-07-04T17:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。