論文の概要: GeoGraph: Geometric and Graph-based Ensemble Descriptors for Intrinsically Disordered Proteins
- arxiv url: http://arxiv.org/abs/2510.00774v1
- Date: Wed, 01 Oct 2025 11:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 14:32:17.202055
- Title: GeoGraph: Geometric and Graph-based Ensemble Descriptors for Intrinsically Disordered Proteins
- Title(参考訳): GeoGraph: 固有のタンパク質の幾何学的およびグラフ的アンサンブル記述子
- Authors: Eoin Quinn, Marco Carobene, Jean Quentin, Sebastien Boyer, Miguel Arbesú, Oliver Bent,
- Abstract要約: シミュレーションインフォームド・サロゲートであるGeoGraphを導入し,残差残差マップトポロジのアンサンブル平均統計をシーケンスから直接予測する。
粗粒度分子動力学シミュレーションを残差レベルおよびシーケンスレベルのグラフ記述子に分解することにより、ロバストで情報豊富な学習ターゲットを作成する。
- 参考スコア(独自算出の注目度): 0.43981305860983716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While deep learning has revolutionized the prediction of rigid protein structures, modelling the conformational ensembles of Intrinsically Disordered Proteins (IDPs) remains a key frontier. Current AI paradigms present a trade-off: Protein Language Models (PLMs) capture evolutionary statistics but lack explicit physical grounding, while generative models trained to model full ensembles are computationally expensive. In this work we critically assess these limits and propose a path forward. We introduce GeoGraph, a simulation-informed surrogate trained to predict ensemble-averaged statistics of residue-residue contact-map topology directly from sequence. By featurizing coarse-grained molecular dynamics simulations into residue- and sequence-level graph descriptors, we create a robust and information-rich learning target. Our evaluation demonstrates that this approach yields representations that are more predictive of key biophysical properties than existing methods.
- Abstract(参考訳): 深層学習は硬質タンパク質構造の予測に革命をもたらしたが、内因性障害タンパク質(IDP)のコンフォメーションアンサンブルをモデル化することは依然として重要なフロンティアである。
現在のAIパラダイムにはトレードオフがある: タンパク質言語モデル(PLM)は進化統計をキャプチャするが、明確な物理的根拠がない。
この研究では、これらの限界を批判的に評価し、前進の道を提案する。
シミュレーションインフォームド・サロゲートであるGeoGraphを導入し,残差残差マップトポロジのアンサンブル平均統計をシーケンスから直接予測する。
粗粒度分子動力学シミュレーションを残差レベルおよびシーケンスレベルのグラフ記述子に分解することにより、ロバストで情報豊富な学習ターゲットを作成する。
提案手法は, 従来の方法よりも重要な生物物理特性を予測可能な表現が得られることを示す。
関連論文リスト
- AI-based Methods for Simulating, Sampling, and Predicting Protein Ensembles [16.635202322160243]
レビューでは、AIによるタンパク質アンサンブルの予測に向けた最近の研究の方向性を強調している。
現在の手法の技術的成熟度に関する現実的な評価に重点を置いている。
私たちは、トレーニングデータの可用性における課題を克服するために、モデルトレーニング、シミュレーション、推論の間の"ループを閉じる"ことを提唱します。
論文 参考訳(メタデータ) (2025-09-21T20:14:45Z) - GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining [19.398985037052224]
分子表現学習のためのグラフレベルの事前学習フレームワークGeoReconを提案する。
事前学習中、モデルは、分子幾何学の再構築を正確に導くことができるグラフ表現を生成するように訓練される。
GeoReconは、ノード中心のベースラインを複数の分子ベンチマークで上回る。
論文 参考訳(メタデータ) (2025-06-16T07:35:49Z) - Learning conformational ensembles of proteins based on backbone geometry [1.1874952582465603]
本稿では,背骨形状のみに基づくタンパク質コンホメーションをサンプリングするためのフローマッチングモデルを提案する。
結果として得られたモデルは、現在の最先端アプローチよりも桁違いに高速で、数日間でスクラッチからトレーニングできる。
論文 参考訳(メタデータ) (2025-02-19T17:16:27Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Graph Generation with Diffusion Mixture [57.78958552860948]
グラフの生成は、非ユークリッド構造の複雑な性質を理解する必要がある実世界のタスクにとって大きな課題である。
本稿では,拡散過程の最終グラフ構造を明示的に学習することにより,グラフのトポロジーをモデル化する生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-07T17:07:46Z) - Topological structure of complex predictions [15.207535648404765]
ディープラーニングのような複雑な予測モデルは、機械学習、ニューラルネットワーク、AIモデルから一連のトレーニングデータに適合する出力である。
我々は、トポロジカル・データ分析を用いて、これらの複雑な予測モデルをトポロジカル・ビューを表す画像に変換する。
本手法は、異なる領域にわたる大規模なデータセットにスケールアップし、トレーニングデータのラベル付けエラーを検出し、画像分類の一般化を理解し、BRCA1遺伝子の病原性変異の予測を検査する。
論文 参考訳(メタデータ) (2022-07-28T19:28:05Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。