論文の概要: Generalising sequence models for epigenome predictions with tissue and
assay embeddings
- arxiv url: http://arxiv.org/abs/2308.11671v1
- Date: Tue, 22 Aug 2023 10:34:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 17:17:44.600055
- Title: Generalising sequence models for epigenome predictions with tissue and
assay embeddings
- Title(参考訳): 組織およびアッセイ埋め込みを用いたエピジェノム予測のための一般化配列モデル
- Authors: Jacob Deasy, Ron Schwessinger, Ferran Gonzalez, Stephen Young, Kim
Branson
- Abstract要約: 組織とアッセイの埋め込みを文脈的ゲノミクスネットワーク(CGN)に組み込むことにより,幅広い実験条件において強い相関性が得られることを示す。
本研究は, エピジェネティック・シークエンス・モデル・トレーニングにおける遺伝的変異の影響について, 幅広いエピジェネティック・プロファイルにまたがるアプローチの有効性を示し, 遺伝子変異がエピジェネティック・シークエンス・モデル・トレーニングに与える影響について考察した。
- 参考スコア(独自算出の注目度): 1.9999259391104391
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sequence modelling approaches for epigenetic profile prediction have recently
expanded in terms of sequence length, model size, and profile diversity.
However, current models cannot infer on many experimentally feasible tissue and
assay pairs due to poor usage of contextual information, limiting $\textit{in
silico}$ understanding of regulatory genomics. We demonstrate that strong
correlation can be achieved across a large range of experimental conditions by
integrating tissue and assay embeddings into a Contextualised Genomic Network
(CGN). In contrast to previous approaches, we enhance long-range sequence
embeddings with contextual information in the input space, rather than
expanding the output space. We exhibit the efficacy of our approach across a
broad set of epigenetic profiles and provide the first insights into the effect
of genetic variants on epigenetic sequence model training. Our general approach
to context integration exceeds state of the art in multiple settings while
employing a more rigorous validation procedure.
- Abstract(参考訳): エピジェネティックプロファイル予測のためのシーケンスモデリングアプローチは、最近、シーケンス長、モデルサイズ、プロファイル多様性の観点から拡張されている。
しかし、現在のモデルでは、文脈情報の使用が不十分なため、多くの実験的に実現可能な組織やアッセイペアを推測することはできず、規制ゲノム学の理解に$\textit{in silico} を制限している。
我々は, 組織とアッセイをコンテクスト化ゲノムネットワーク(cgn)に組み込むことにより, 幅広い実験条件において強い相関が達成できることを実証する。
従来の手法とは対照的に、出力空間を広げるのではなく、入力空間に文脈情報を含む長距離シーケンス埋め込みを強化する。
我々は、エピジェネティックなプロファイルの幅広いセットにまたがるアプローチの有効性を示し、エピジェネティックなシーケンスモデルトレーニングにおける遺伝的変異の影響に関する最初の知見を提供する。
コンテキスト統合に対する一般的なアプローチは、より厳密な検証手順を採用しながら、複数の設定でアートの状態を超えます。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Correlational Lagrangian Schr\"odinger Bridge: Learning Dynamics with
Population-Level Regularization [27.855576268065857]
相関型Lagrangian Schr"odinger Bridge (CLSB) と呼ばれる新しいフレームワークを紹介する。
CLSBは、最小人口の「コスト」のために正規化しながら、クロステキスト観察における進化の「ブリッジング」を求める
本研究の貢献は,(1)多変量関係における時間的変動を捉えた新しい集団正規化器群,(3)遺伝的共発現安定性に基づく3つのドメインインフォームドインスタンス化である。
論文 参考訳(メタデータ) (2024-02-04T19:33:44Z) - Toward the Identifiability of Comparative Deep Generative Models [7.5479347719819865]
比較深部生成モデル(DGM)における識別可能性の理論を提案する。
これらのモデルは、一般的な混合関数のクラスにおいて識別性に欠けるが、混合関数が断片的アフィンであるときに驚くほど識別可能であることを示す。
また, モデルミス種別の影響についても検討し, 従来提案されていた比較DGMの正則化手法が, 潜伏変数の数が事前に分かっていない場合に, 識別可能性を高めることを実証的に示す。
論文 参考訳(メタデータ) (2024-01-29T06:10:54Z) - PhyloGFN: Phylogenetic inference with generative flow networks [59.56365488043478]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Bayesian Additive Main Effects and Multiplicative Interaction Models
using Tensor Regression for Multi-environmental Trials [0.0]
本稿では,複数の因子が表現型予測に与える影響を考慮したベイズテンソル回帰モデルを提案する。
我々は、モデルのパラメータ間で生じる可能性のある識別可能性の問題を解決するための、事前分布のセットを採用する。
我々は2010年から2019年までのアイルランドにおける小麦生産に関する実世界のデータを分析して、我々のモデルの適用性を探る。
論文 参考訳(メタデータ) (2023-01-09T19:54:50Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。