Fugu-MT 論文翻訳(概要): Generalising sequence models for epigenome predictions with tissue and assay embeddings

論文の概要: Generalising sequence models for epigenome predictions with tissue and assay embeddings

arxiv url: http://arxiv.org/abs/2308.11671v1
Date: Tue, 22 Aug 2023 10:34:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-24 17:17:44.600055
Title: Generalising sequence models for epigenome predictions with tissue and assay embeddings
Title（参考訳）: 組織およびアッセイ埋め込みを用いたエピジェノム予測のための一般化配列モデル
Authors: Jacob Deasy, Ron Schwessinger, Ferran Gonzalez, Stephen Young, Kim Branson
Abstract要約: 組織とアッセイの埋め込みを文脈的ゲノミクスネットワーク(CGN)に組み込むことにより,幅広い実験条件において強い相関性が得られることを示す。本研究は, エピジェネティック・シークエンス・モデル・トレーニングにおける遺伝的変異の影響について, 幅広いエピジェネティック・プロファイルにまたがるアプローチの有効性を示し, 遺伝子変異がエピジェネティック・シークエンス・モデル・トレーニングに与える影響について考察した。
参考スコア（独自算出の注目度）: 1.9999259391104391
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Sequence modelling approaches for epigenetic profile prediction have recently expanded in terms of sequence length, model size, and profile diversity. However, current models cannot infer on many experimentally feasible tissue and assay pairs due to poor usage of contextual information, limiting $\textit{in silico}$ understanding of regulatory genomics. We demonstrate that strong correlation can be achieved across a large range of experimental conditions by integrating tissue and assay embeddings into a Contextualised Genomic Network (CGN). In contrast to previous approaches, we enhance long-range sequence embeddings with contextual information in the input space, rather than expanding the output space. We exhibit the efficacy of our approach across a broad set of epigenetic profiles and provide the first insights into the effect of genetic variants on epigenetic sequence model training. Our general approach to context integration exceeds state of the art in multiple settings while employing a more rigorous validation procedure.
Abstract（参考訳）: エピジェネティックプロファイル予測のためのシーケンスモデリングアプローチは、最近、シーケンス長、モデルサイズ、プロファイル多様性の観点から拡張されている。しかし、現在のモデルでは、文脈情報の使用が不十分なため、多くの実験的に実現可能な組織やアッセイペアを推測することはできず、規制ゲノム学の理解に$\textit{in silico} を制限している。我々は, 組織とアッセイをコンテクスト化ゲノムネットワーク(cgn)に組み込むことにより, 幅広い実験条件において強い相関が達成できることを実証する。従来の手法とは対照的に、出力空間を広げるのではなく、入力空間に文脈情報を含む長距離シーケンス埋め込みを強化する。我々は、エピジェネティックなプロファイルの幅広いセットにまたがるアプローチの有効性を示し、エピジェネティックなシーケンスモデルトレーニングにおける遺伝的変異の影響に関する最初の知見を提供する。コンテキスト統合に対する一般的なアプローチは、より厳密な検証手順を採用しながら、複数の設定でアートの状態を超えます。

関連論文リスト

Inferring genotype-phenotype maps using attention models [0.21990652930491852]
遺伝子型から表現型を予測することは遺伝学における中心的な課題である。機械学習の最近の進歩、特に注意に基づくモデルは、有望な代替手段を提供する。ここでは、注意に基づくモデルを定量的遺伝学に適用する。
論文参考訳（メタデータ） (2025-04-14T16:32:17Z)
Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer [1.5416321520529301]
PEKA(Efficient Knowledge Adaptation)は、クロスモーダルな知識伝達のための知識蒸留と構造アライメント損失を統合する新しいフレームワークである。複数の空間転写学データセットを用いた遺伝子発現予測のためのPEKAの評価を行った。
論文参考訳（メタデータ） (2025-04-09T17:24:41Z)
UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文参考訳（メタデータ） (2025-03-09T16:43:07Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
Continually Evolved Multimodal Foundation Models for Cancer Prognosis [50.43145292874533]
がん予後は、患者の予後と生存率を予測する重要なタスクである。これまでの研究では、臨床ノート、医療画像、ゲノムデータなどの多様なデータモダリティを統合し、補完的な情報を活用している。既存のアプローチには2つの大きな制限がある。まず、各病院の患者記録など、各種のトレーニングに新しく到着したデータを組み込むことに苦慮する。第二に、ほとんどのマルチモーダル統合手法は単純化された結合やタスク固有のパイプラインに依存しており、モダリティ間の複雑な相互依存を捉えることができない。
論文参考訳（メタデータ） (2025-01-30T06:49:57Z)
A Non-negative VAE:the Generalized Gamma Belief Network [49.970917207211556]
ガンマ信念ネットワーク(GBN)は、テキストデータ中の多層解釈可能な潜在表現を明らかにする可能性を実証している。本稿では、一般化ガンマ信念ネットワーク(Generalized GBN)を導入し、元の線形生成モデルをより表現力のある非線形生成モデルに拡張する。また、潜伏変数の後方分布を近似する上向きのワイブル推論ネットワークを提案する。
論文参考訳（メタデータ） (2024-08-06T18:18:37Z)
U-learning for Prediction Inference via Combinatory Multi-Subsampling: With Applications to LASSO and Neural Networks [5.587500517608073]
エピジェネティックな老化時計は、DNAメチル化パターンを調べることによって、個人の生物学的年齢を推定する上で重要な役割を担っている。アンサンブル予測のためのマルチサブラーニングによる新しいUサンプリング手法を提案する。より具体的には、一般化されたU統計学の枠組みにおけるアンサンブル推定器を概念化する。提案手法はLassoとDeep Neural Network(DNN)の2つの一般的な予測アルゴリズムに適用し,広範囲な数値研究による推論の有効性を示す。
論文参考訳（メタデータ） (2024-07-22T00:03:51Z)
Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文参考訳（メタデータ） (2024-07-16T14:05:03Z)
Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文参考訳（メタデータ） (2024-07-03T10:31:30Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳（メタデータ） (2024-05-13T20:15:03Z)
Seeing Unseen: Discover Novel Biomedical Concepts via Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文参考訳（メタデータ） (2024-03-02T00:56:05Z)
Efficient and Scalable Fine-Tune of Language Models for Genome Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。 DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。 textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文参考訳（メタデータ） (2024-02-12T21:40:45Z)
Heterogeneous Transfer Learning for Building High-Dimensional Generalized Linear Models with Disparate Datasets [0.0]
本稿では,高次元一般化線形モデル構築のための伝達学習手法について述べる。我々は、すべての予測器に関する詳細な情報と、より限定された予測器のセットを持つ、より大きい、潜在的にはるかに大きな研究データを用いて、主研究からのデータを使用します。
論文参考訳（メタデータ） (2023-12-20T06:11:59Z)
Mutual Exclusivity Training and Primitive Augmentation to Induce Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文参考訳（メタデータ） (2022-11-28T17:36:41Z)
Multi-modality fusion using canonical correlation analysis methods: Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文参考訳（メタデータ） (2021-11-27T21:18:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。