論文の概要: Learning Topological Representations for Molecular Dynamics
- arxiv url: http://arxiv.org/abs/2606.14737v1
- Date: Tue, 02 Jun 2026 13:26:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.758567
- Title: Learning Topological Representations for Molecular Dynamics
- Title(参考訳): 分子動力学におけるトポロジカル表現の学習
- Authors: Dominik Geng, Florian Graf, Martin Uray, Roland Kwitt,
- Abstract要約: 分子動力学の汎用表現として永続ホモロジー(PH)を考察する。
最近導入された単純複合体構築のタンパク質調整修飾であるマスク付きフラッド複合体を導入する。
学習した低次元座標から,タンパク質のクラス予測,フレームレベルの可観測回帰,マルコフ状態モデル(MSM)の推定について検討した。
- 参考スコア(独自算出の注目度): 6.371142192684222
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Molecular dynamics (MD) simulations generate trajectories in a high-dimensional configuration space whose analysis critically depends on molecular descriptors, typically handcrafted observables or learned kinetic embeddings. Designing descriptors that are both expressive and broadly applicable, however, remains challenging. We study persistent homology (PH) as a general-purpose representation for MD and introduce the masked Flood complex, a protein-tailored modification of a recently introduced simplicial complex construction that emphasizes inter-residue structure at low computational cost. Vectorized persistence diagrams then provide information-rich, geometry-aware summaries of protein conformations, which we evaluate on protein class prediction, frame-level observable regression, and Markov state model (MSM) estimation from learned low-dimensional coordinates in a single shared representation space. Results on the mdCATH dataset show that PH-based descriptors are competitive across tasks, with masked Flood PH yielding the most consistent overall performance. Further, when using topologically-informed MSMs as a drop-in replacement within the recent MarS-FM framework for generative modeling of protein conformations, we obtain consistently better ensemble statistics than MSMs based on physical observables. Finally, we explore the transferability of the generative model to qualitatively different, fast folding, proteins.
- Abstract(参考訳): 分子動力学(MD)シミュレーションは、解析が分子記述子、通常は手作りの可観測物や学習された運動的埋め込みに依存する高次元構成空間において軌道を生成する。
しかし、表現的かつ広く適用可能な記述子を設計することは依然として困難である。
我々は,MDの汎用表現として永続的ホモロジー(PH)を研究し,最近導入された単純化された複合体構造を,低計算コストで残像間構造を強調したタンパク質調整型Flood複合体を導入する。
ベクトル化された永続化ダイアグラムは、タンパク質のクラス予測、フレームレベルの可観測回帰、および単一の共有表現空間における学習された低次元座標からのマルコフ状態モデル(MSM)の推定に基づいて、タンパク質コンホメーションの情報に富んだ幾何対応の要約を提供する。
mdCATHデータセットの結果から、PHベースのディスクリプタはタスク間で競合し、マスクされたFlood PHが最も一貫性のある全体的なパフォーマンスが得られることが示された。
さらに, タンパク質コンホメーション生成のための最近のMarS-FMフレームワークにおいて, トポロジカルにインフォームされたMSMをドロップイン置換として使用する場合, 物理観測値に基づくMSMよりも一貫してより良いアンサンブル統計値が得られる。
最後に、生成モデルの質的に異なる高速な折りたたみタンパク質への転写可能性について検討する。
関連論文リスト
- A Systematic Survey and Benchmark of Deep Learning for Molecular Property Prediction in the Foundation Model Era [57.5440098776759]
分子特性予測は、量子化学、化学情報学、深層学習を統合し、分子構造と生物学的挙動を結びつける。
この調査は、Quantum、Descriptor Machine Learning、Geometric Deep Learning、Foundation Modelsの4つの補完パラダイムをトレースする。
ベンチマーク分析は、広く使われているデータセットと業界的な視点を反映したデータセットの両方からエビデンスを統合する。
論文 参考訳(メタデータ) (2026-04-17T15:16:33Z) - Align Your Structures: Generating Trajectories with Structure Pretraining for Molecular Dynamics [57.2871599860811]
MD軌道生成のための構造事前学習を利用する新しいフレームワークを提案する。
提案手法は,MDトラジェクトリデータの不足を軽減するために,豊富な構造データを効果的に活用する。
実験結果から,本手法は化学的に現実的なMDトラジェクトリの生成に優れていることが確認された。
論文 参考訳(メタデータ) (2026-04-05T00:37:28Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Towards CONUS-Wide ML-Augmented Conceptually-Interpretable Modeling of Catchment-Scale Precipitation-Storage-Runoff Dynamics [3.442981587977714]
本研究は,Mass-Conserving Perceptron(MCP)に基づく,様々なキャッチメント複雑性のML拡張物理解釈スケールモデルを用いた。
その結果,積雪,森林被覆,気候帯などの属性マスクを用いて評価した。
ベンチマーク比較により、物理的に解釈可能な大量保存型MPPベースのモデルでは、Long Short-Term Memory Network (LSTM)アーキテクチャに基づくデータベースモデルに匹敵する性能が得られることが示された。
論文 参考訳(メタデータ) (2025-10-02T22:47:01Z) - Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - MoDyGAN: Combining Molecular Dynamics With GANs to Investigate Protein Conformational Space [0.0]
MoDyGANは、分子動力学シミュレーションと生成敵ネットワーク(GAN)を利用してタンパク質コンフォメーション空間を探索するパイプラインである。
MoDyGANには、ガウス分布をMD由来のタンパク質軌道にマッピングするジェネレータと、アンサンブル学習と二重識別器を組み合わせた精製モジュールが含まれている。
我々のアプローチの中心は、3Dタンパク質構造を2D行列に可逆的に変換する革新的な表現技術である。
以上の結果から,タンパク質をイメージライクなデータとして表現することは,生物分子シミュレーションに高度な深層学習技術を適用する新たな可能性を開くことが示唆された。
論文 参考訳(メタデータ) (2025-07-18T14:18:28Z) - Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression [45.49904590474368]
ConfRoverは自己回帰モデルであり、MD軌道からタンパク質のコンホメーションとダイナミクスを同時に学習する。
時間に依存しないサンプリングと時間に依存しないサンプリングの両方をサポートする。
大規模タンパク質MDデータセットであるATLASの実験は、我々のモデルの有効性を実証している。
論文 参考訳(メタデータ) (2025-05-23T05:00:15Z) - Geometry Matters: Benchmarking Scientific ML Approaches for Flow Prediction around Complex Geometries [23.111935712144277]
複雑な幾何学体を取り巻く流体力学の迅速かつ正確なシミュレーションは、様々な工学的・科学的応用において重要である。
科学機械学習(SciML)はかなりの可能性を示してきたが、この分野のほとんどの研究は単純な幾何学に限られている。
本稿では,複雑な地形上での流動予測のための多種多様なSciMLモデルのベンチマークにより,このギャップを解消する。
論文 参考訳(メタデータ) (2024-12-31T00:23:15Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Str2Str: A Score-based Framework for Zero-shot Protein Conformation
Sampling [23.74897713386661]
タンパク質の動的性質は、その生物学的機能や性質を決定するために重要である。
既存の学習ベースのアプローチでは、直接サンプリングを行うが、トレーニングにはターゲット固有のシミュレーションデータに大きく依存する。
ゼロショットコンフォーメーションサンプリングが可能な新しい構造間翻訳フレームワークStr2Strを提案する。
論文 参考訳(メタデータ) (2023-06-05T15:19:06Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。