論文の概要: Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers
- arxiv url: http://arxiv.org/abs/2603.07472v1
- Date: Sun, 08 Mar 2026 05:19:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.61906
- Title: Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers
- Title(参考訳): 拡散変換器による大腸菌の接触誘導3次元ゲノム構造生成
- Authors: Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin,
- Abstract要約: 我々は、条件付き生成モデル問題としてゲノム再構成を定式化する。
粗粒分子動力学シミュレーションを用いて合成データセットを構築する。
我々のモデルは変分オートエンコーダを用いて潜時拡散設定で動作する。
ホールドアウトアンサンブルでは、生成された構造は、入力されたHi-C距離デカイと構造相関メトリクスを再現する。
- 参考スコア(独自算出の注目度): 4.9416904219463165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this study, we present a conditional diffusion-transformer framework for generating ensembles of three-dimensional Escherichia coli genome conformations guided by Hi-C contact maps. Instead of producing a single deterministic structure, we formulate genome reconstruction as a conditional generative modeling problem that samples heterogeneous conformations whose ensemble-averaged contacts are consistent with the input Hi-C data. A synthetic dataset is constructed using coarse-grained molecular dynamics simulations to generate chromatin ensembles and corresponding Hi-C maps under circular topology. Our models operate in a latent diffusion setting with a variational autoencoder that preserves per-bin alignment and supports replication-aware representations. Hi-C information is injected through a transformer-based encoder and cross-attention, enforcing a physically interpretable one-way constraint from Hi-C to structure. The model is trained using a flow-matching objective for stable optimization. On held-out ensembles, generated structures reproduce the input Hi-C distance-decay and structural correlation metrics while maintaining substantial conformational diversity, demonstrating the effectiveness of diffusion-based generative modeling for ensemble-level 3D genome reconstruction.
- Abstract(参考訳): 本研究では,Hi-Cコンタクトマップでガイドされた3次元大腸菌ゲノムコンフォメーションのアンサンブルを生成するための条件拡散変換器フレームワークを提案する。
単一決定論的構造を生成する代わりに、入力されたHi-Cデータと平均的な接点が一致した異種構造をサンプリングする条件生成モデル問題としてゲノム再構成を定式化する。
粗粒分子動力学シミュレーションを用いて合成データセットを構築し, 円形トポロジーの下でクロマチンアンサンブルと対応するHi-Cマップを生成する。
我々のモデルは、ビンごとのアライメントを保ち、複製認識表現をサポートする変分オートエンコーダを用いて、潜時拡散設定で動作する。
Hi-C情報は、変換器ベースのエンコーダとクロスアテンションを介して注入され、Hi-Cから構造への物理的に解釈可能な片方向の制約を強制する。
このモデルは、安定した最適化のためにフローマッチングの目的を用いて訓練される。
ホールドアウトアンサンブルにおいて、生成された構造は、実質的なコンフォメーションの多様性を維持しつつ、入力されたHi-C距離デカイと構造相関のメトリクスを再現し、アンサンブルレベル3次元ゲノム再構成のための拡散ベース生成モデルの有効性を実証した。
関連論文リスト
- Sampling 3D Molecular Conformers with Diffusion Transformers [13.536503487456622]
拡散変換器 (DiT) は生成モデルにおいて高い性能を示した。
分子へのDiTの適用は、離散的な分子グラフ情報と連続した3次元幾何学の統合など、新しい課題をもたらす。
モジュールアーキテクチャを通じてこれらの課題に対処するために,DiTを適応させるフレームワークであるDiTMCを提案する。
論文 参考訳(メタデータ) (2025-06-18T11:47:59Z) - Multiscale guidance of AlphaFold3 with heterogeneous cryo-EM data [33.562685684224995]
低温電子顕微鏡(cryo-EM)は、近原性構造不均一性をイメージングするための強力なツールとして登場した。
ここでは, タンパク質構造予測モデルを用いて学習したCryo-EM密度マップと, 豊富な配列と生物物理学的先行データを組み合わせる。
我々の方法であるCryoBoltzは、大域的および局所的な構造制約を用いて、事前訓練されたタンパク質構造予測モデルのサンプリング軌跡を導出する。
論文 参考訳(メタデータ) (2025-06-04T22:16:27Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.23688195918432]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - CoarsenConf: Equivariant Coarsening with Aggregated Attention for
Molecular Conformer Generation [3.31521245002301]
本稿では, 反角に基づく分子グラフをSE(3)等価な階層的変分オートエンコーダに統合するCoarsenConfを紹介する。
等変粗粒化により、回転可能な結合を介して連結された部分グラフの微細な原子座標を集約し、可変長粗粒化潜在表現を生成する。
本モデルでは, 粗粒の潜在表現から細粒度座標を復元する新しいアグリゲートアテンション機構を用いて, 正確なコンフォメータを効率よく生成する。
論文 参考訳(メタデータ) (2023-06-26T17:02:54Z) - Accurate and Efficient Structural Ensemble Generation of Macrocyclic Peptides using Internal Coordinate Diffusion [0.5475672579692472]
RINGERは拡散型トランスフォーマーモデルであり、その2次元表現から大環状ペプチドの3次元コンフォメーションアンサンブルを生成する。
本稿では,RINGERが計算コストのごく一部で高品質かつ多様なジオメトリを生成する方法を示す。
論文 参考訳(メタデータ) (2023-05-30T16:39:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。