論文の概要: UNADON: Transformer-based model to predict genome-wide chromosome
spatial position
- arxiv url: http://arxiv.org/abs/2304.13230v1
- Date: Wed, 26 Apr 2023 01:30:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 15:45:01.280805
- Title: UNADON: Transformer-based model to predict genome-wide chromosome
spatial position
- Title(参考訳): UNADON:トランスフォーマーを用いたゲノムワイド染色体空間位置予測モデル
- Authors: Muyu Yang and Jian Ma
- Abstract要約: UNADONと呼ばれるトランスフォーマーに基づく新しいディープラーニングモデルを開発した。
特定のタイプの核体へのゲノム全体の細胞学的距離を予測する。
核体への大規模な区画化に影響を及ぼす潜在的な配列とエピジェノミクス因子を明らかにする。
- 参考スコア(独自算出の注目度): 2.3980064191633232
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The spatial positioning of chromosomes relative to functional nuclear bodies
is intertwined with genome functions such as transcription. However, the
sequence patterns and epigenomic features that collectively influence chromatin
spatial positioning in a genome-wide manner are not well understood. Here, we
develop a new transformer-based deep learning model called UNADON, which
predicts the genome-wide cytological distance to a specific type of nuclear
body, as measured by TSA-seq, using both sequence features and epigenomic
signals. Evaluations of UNADON in four cell lines (K562, H1, HFFc6, HCT116)
show high accuracy in predicting chromatin spatial positioning to nuclear
bodies when trained on a single cell line. UNADON also performed well in an
unseen cell type. Importantly, we reveal potential sequence and epigenomic
factors that affect large-scale chromatin compartmentalization to nuclear
bodies. Together, UNADON provides new insights into the principles between
sequence features and large-scale chromatin spatial localization, which has
important implications for understanding nuclear structure and function.
- Abstract(参考訳): 機能核体に対する染色体の空間的位置決めは、転写などのゲノム機能と相互作用する。
しかし、ゲノム全体にわたってクロマチンの空間的位置決定に影響を与える配列パターンやエピゲノミクスの特徴はよく分かっていない。
そこで本研究では,TSA-seqによって測定された特定のタイプの核体へのゲノムワイド細胞学的距離を,シーケンス特性とエピジェノミック信号の両方を用いて予測する。
4つの細胞株 (K562, H1, HFFc6, HCT116) における UNADON の評価は, 単一細胞株で訓練した場合の核体へのクロマチン空間位置の予測において高い精度を示した。
UNADONは未確認の細胞型でもよく機能した。
重要なのは,核体へのクロマチンの大規模区画化に影響を及ぼす潜在配列とエピゲノミクス因子を明らかにすることである。
UNADONは、配列の特徴と大規模クロマチン空間局在の原理に関する新たな知見を提供し、核構造や機能を理解する上で重要な意味を持つ。
関連論文リスト
- VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文 参考訳(メタデータ) (2024-05-09T09:34:51Z) - Machine and deep learning methods for predicting 3D genome organization [0.0]
3次元(3D)エンハンサー相互作用は、遺伝子発現を調節することにより、幅広い細胞プロセスにおいて重要な役割を果たす。
機械学習の手法は、欠落した3Dインタラクションを入手したり、解像度を向上したりするための代替手段として登場した。
本稿では,3種類の3次元インタラクション(EPI,インタラクション,TAD境界)を予測し,その長所と短所を解析するための計算ツールについて論じる。
論文 参考訳(メタデータ) (2024-03-04T19:04:41Z) - A metric embedding kernel for live cell microscopy signaling patterns [0.1547863211792184]
本稿では,5次元ライブ細胞顕微鏡で捉えた細胞シグナルのパターンを計測するカーネル機能について述べる。
このアプローチでは、ケルモゴロフ複雑性理論を用いて距離と映画を計算し、意味のある情報を測定する。
異なる腫瘍原性変異間のERKおよびAKTシグナル伝達の影響を定量化する。
論文 参考訳(メタデータ) (2024-01-04T19:25:00Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Analyzing scRNA-seq data by CCP-assisted UMAP and t-SNE [0.0]
相関クラスタリングとプロジェクション(CCP)は、cRNA-seqデータを前処理する有効な方法として導入された。
CCPは、行列対角化を必要としないデータドメインアプローチである。
8つの公開データセットを使用することで、CCPは UMAP と t-SNE の可視化を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-06-23T19:15:43Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Epigenomic language models powered by Cerebras [0.0]
エピゲノムBERT(またはEBERT)は、DNA配列とペア化されたエピジェネティック状態の入力の両方に基づいて表現を学習する。
細胞型特異的転写因子結合予測タスクにおいて,EBERTの転写学習能力を示す。
ENCODE-DREAMベンチマークから得られた13つの評価データセットのうち4つは、我々の微調整されたモデルであり、挑戦のリーダーボードでは総合3位である。
論文 参考訳(メタデータ) (2021-12-14T17:23:42Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。