論文の概要: CONFIDE: Hallucination Assessment for Reliable Biomolecular Structure Prediction and Design
- arxiv url: http://arxiv.org/abs/2512.02033v1
- Date: Thu, 20 Nov 2025 03:38:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.424148
- Title: CONFIDE: Hallucination Assessment for Reliable Biomolecular Structure Prediction and Design
- Title(参考訳): CONFIDE: 信頼性の高い生体分子構造予測と設計のための幻覚評価
- Authors: Zijun Gao, Mutian He, Shijia Sun, Hanqun Cao, Jingjie Zhang, Zihao Luo, Xiaorui Wang, Xiaojun Yao, Chang-Yu Hsieh, Chunbin Gu, Pheng Ann Heng,
- Abstract要約: 本稿では,位相的フラストレーションを定量化する自己評価尺度であるCODE(Chain of Diffusion Embeddings)を提案する。
エネルギー的およびトポロジ的視点を組み合わせた統合評価フレームワークであるCONFIDEを提案する。
データ駆動の埋め込みと理論的な洞察を組み合わせることで、CODEとConFIDEは、幅広い生体分子システムで既存の指標より優れています。
- 参考スコア(独自算出の注目度): 46.12506067241116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable evaluation of protein structure predictions remains challenging, as metrics like pLDDT capture energetic stability but often miss subtle errors such as atomic clashes or conformational traps reflecting topological frustration within the protein folding energy landscape. We present CODE (Chain of Diffusion Embeddings), a self evaluating metric empirically found to quantify topological frustration directly from the latent diffusion embeddings of the AlphaFold3 series of structure predictors in a fully unsupervised manner. Integrating this with pLDDT, we propose CONFIDE, a unified evaluation framework that combines energetic and topological perspectives to improve the reliability of AlphaFold3 and related models. CODE strongly correlates with protein folding rates driven by topological frustration, achieving a correlation of 0.82 compared to pLDDT's 0.33 (a relative improvement of 148\%). CONFIDE significantly enhances the reliability of quality evaluation in molecular glue structure prediction benchmarks, achieving a Spearman correlation of 0.73 with RMSD, compared to pLDDT's correlation of 0.42, a relative improvement of 73.8\%. Beyond quality assessment, our approach applies to diverse drug design tasks, including all-atom binder design, enzymatic active site mapping, mutation induced binding affinity prediction, nucleic acid aptamer screening, and flexible protein modeling. By combining data driven embeddings with theoretical insight, CODE and CONFIDE outperform existing metrics across a wide range of biomolecular systems, offering robust and versatile tools to refine structure predictions, advance structural biology, and accelerate drug discovery.
- Abstract(参考訳): pLDDTのような指標はエネルギー安定性を捉えるが、原子衝突やタンパク質の折りたたみエネルギーの地形における位相的フラストレーションを反映するコンフォメーショントラップのような微妙な誤りをしばしば見逃すため、タンパク質構造予測の信頼性の評価は依然として難しい。
我々は,AlphaFold3級構造予測器の潜伏拡散埋め込みから直接,位相的フラストレーションを定量的に定量化することが実証された自己評価指標であるCODE(Chain of Diffusion Embeddings)を提案する。
我々はこれをpLDDTと統合し、AlphaFold3と関連するモデルの信頼性を向上させるために、エネルギー的およびトポロジ的視点を組み合わせた統合評価フレームワークであるCONFIDEを提案する。
CODEは、トポロジカルフラストレーションによって引き起こされるタンパク質の折り畳み速度と強く相関し、pLDDTの0.33(相対的な改善:148\%)と比較して0.82の相関を達成している。
CONFIDEは分子接着構造予測ベンチマークにおける品質評価の信頼性を大幅に向上させ、pLDDTの0.42と相対的な73.8倍の相関であるRMSDとのスピアマン相関を達成した。
品質評価以外にも、全原子バインダー設計、酵素活性部位マッピング、変異誘発結合親和性予測、核酸アプタマースクリーニング、柔軟なタンパク質モデリングなど様々な薬物設計タスクに適用した。
データ駆動の埋め込みと理論的な洞察を組み合わせることで、CODEとConFIDEは、さまざまな生体分子システムで既存の指標を上回り、構造予測の洗練、構造生物学の進歩、薬物発見の加速など、堅牢で汎用的なツールを提供する。
関連論文リスト
- FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation [19.153777175873547]
FP-AbDiffはFokker-Planck Equation (FPE) 物理を誘導する最初の抗体生成装置である。
生成力学を物理法則と整合させることにより、FP-AbDiffは堅牢性と一般化性を高め、物理的に忠実で機能的に実行可能な抗体設計のための原則化されたアプローチを確立する。
論文 参考訳(メタデータ) (2025-11-05T01:44:37Z) - FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction [5.216915896877018]
FLOWR:rootは、ポケット対応の3Dリガンド生成のための均質なフローマッチングモデルである。
デ・ノボ生成、薬局補充条件サンプリング、フラグメント・エラボレーション、親和性予測をサポートする。
論文 参考訳(メタデータ) (2025-10-02T21:38:26Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Manifold-Constrained Nucleus-Level Denoising Diffusion Model for Structure-Based Drug Design [81.95343363178662]
原子は分離違反を避けるために 最小の対距離を維持する必要がある
NucleusDiff は原子核と周囲の電子雲の間の相互作用を距離制約によってモデル化する。
違反率は1000%まで減少し、結合親和性は22.16%まで向上し、構造に基づく薬物設計の最先端モデルを上回る。
論文 参考訳(メタデータ) (2024-09-16T08:42:46Z) - SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.406882192023597]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。
伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。
この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文 参考訳(メタデータ) (2024-07-10T08:40:07Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。