論文の概要: AlphaFold Database Debiasing for Robust Inverse Folding
- arxiv url: http://arxiv.org/abs/2506.08365v1
- Date: Tue, 10 Jun 2025 02:25:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:41.16844
- Title: AlphaFold Database Debiasing for Robust Inverse Folding
- Title(参考訳): AlphaFold Database Debiasing for Robust Inverse Folding
- Authors: Cheng Tan, Zhenxiao Cao, Zhangyang Gao, Siyuan Li, Yufei Huang, Stan Z. Li,
- Abstract要約: Debiasing Structure AutoEncoder (DeSAE)を導入し、故意に破損したバックボーンジオメトリからネイティブライクなコンフォーメーションを再構築することを学ぶ。
推測において、DeSAEをAFDB構造に適用すると、逆折り畳み性能を著しく向上する偏りのある構造が生成される。
- 参考スコア(独自算出の注目度): 58.792020809180336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The AlphaFold Protein Structure Database (AFDB) offers unparalleled structural coverage at near-experimental accuracy, positioning it as a valuable resource for data-driven protein design. However, its direct use in training deep models that are sensitive to fine-grained atomic geometry, such as inverse folding, exposes a critical limitation. Comparative analysis of structural feature distributions reveals that AFDB structures exhibit distinct statistical regularities, reflecting a systematic geometric bias that deviates from the conformational diversity found in experimentally determined structures from the Protein Data Bank (PDB). While AFDB structures are cleaner and more idealized, PDB structures capture the intrinsic variability and physical realism essential for generalization in downstream tasks. To address this discrepancy, we introduce a Debiasing Structure AutoEncoder (DeSAE) that learns to reconstruct native-like conformations from intentionally corrupted backbone geometries. By training the model to recover plausible structural states, DeSAE implicitly captures a more robust and natural structural manifold. At inference, applying DeSAE to AFDB structures produces debiased structures that significantly improve inverse folding performance across multiple benchmarks. This work highlights the critical impact of subtle systematic biases in predicted structures and presents a principled framework for debiasing, significantly boosting the performance of structure-based learning tasks like inverse folding.
- Abstract(参考訳): AlphaFold Protein Structure Database (AFDB)は、データ駆動型タンパク質設計のための貴重なリソースとして、ほぼ実験的な精度で非並列構造カバレッジを提供する。
しかし、逆折り畳みのような微細な原子幾何学に敏感な深層モデルの訓練において直接的に使用されることは、臨界限界を露呈する。
構造的特徴分布の比較分析により、AFDB構造は、タンパク質データバンク(PDB)から実験的に決定された構造にみられる構造的多様性から逸脱する、体系的な幾何学的バイアスを反映して、異なる統計的規則性を示すことが明らかとなった。
AFDB構造はよりクリーンでより理想化されたものであるが、PDB構造は下流タスクの一般化に不可欠な本質的な変動性と物理的現実性を捉えている。
この相違に対処するために、故意に破損したバックボーンジオメトリからネイティブライクなコンフォーメーションを再構築するDebiasing Structure AutoEncoder (DeSAE)を導入する。
モデルに可塑性構造状態の回復を訓練することにより、DeSAEはより頑丈で自然な構造多様体を暗黙的にキャプチャする。
推論において、DeSAEをAFDB構造に適用すると、複数のベンチマークでの逆折り畳み性能を著しく向上する偏りのある構造が生成される。
この研究は、予測された構造における微妙な体系的バイアスの批判的影響を強調し、デバイアスの原則的枠組みを示し、逆折り畳みのような構造に基づく学習タスクのパフォーマンスを大幅に向上させる。
関連論文リスト
- Fast and Reliable Probabilistic Reflectometry Inversion with Prior-Amortized Neural Posterior Estimation [73.81105275628751]
リフレクションメトリデータと互換性のある全ての構造を見つけることは、標準アルゴリズムでは計算が禁止される。
この信頼性の欠如に対処するため,確率論的深層学習法を用いて,現実的な構造を数秒で識別する。
提案手法は,シミュレーションに基づく推論と新しい適応型事前推定を併用する。
論文 参考訳(メタデータ) (2024-07-26T10:29:16Z) - Protein 3D Graph Structure Learning for Robust Structure-based Protein
Property Prediction [43.46012602267272]
タンパク質の構造に基づく特性予測は、様々な生物学的タスクにおいて有望なアプローチとして現れてきた。
現在のプラクティスは、推論中に正確に予測された構造を用いるだけで、予測精度の顕著な低下に悩まされている。
本フレームワークはモデルに依存しず,予測構造と実験構造の両方の特性予測の改善に有効である。
論文 参考訳(メタデータ) (2023-10-14T08:43:42Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - dotears: Scalable, consistent DAG estimation using observational and
interventional data [1.220743263007369]
因果性遺伝子制御ネットワークはDAG(direct acyclic graph)によって表現できる
単一の因果構造を推論する継続的最適化フレームワークであるtexttdotears$[doo-tairs]を提示する。
我々は、$texttdotears$は、軽度の仮定の下で真DAGの証明可能な一貫した推定量であることを示した。
論文 参考訳(メタデータ) (2023-05-30T17:03:39Z) - StrAE: Autoencoding for Pre-Trained Embeddings using Explicit Structure [5.2869308707704255]
StrAEは構造化オートエンコーダフレームワークであり、明示的な構造に厳格に固執することで、マルチレベル表現の効果的な学習を可能にする。
本研究の結果は,入力として提供される構造に直接的な関連性があることを示し,既存のツリーモデルではそうではないことを示す。
次に、StrAEを拡張して、単純なローカライズ・マージアルゴリズムを用いてモデルが独自の構成を定義する。
論文 参考訳(メタデータ) (2023-05-09T16:20:48Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Structural Bias for Aspect Sentiment Triplet Extraction [15.273669042985883]
アスペクト感情三重項抽出(ASTE)には構造バイアスが利用され,性能が向上した。
構造バイアスを明示的に組み込むことは効率に悪影響を及ぼすが、事前訓練された言語モデル(PLM)はすでに暗黙的な構造を捉えることができる。
そこで本研究では,PLMにおける構造バイアスを統合するためのアダプタと,低コストで計算可能な相対的位置構造を用いて,効率上の問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-09-02T05:02:18Z) - Differentiable and Transportable Structure Learning [73.84540901950616]
本稿では,新しいアーキテクチャと損失関数により,発見された構造物の輸送性を回復するD-Structを紹介する。
D-Structは依然として微分可能であるため、既存の微分可能アーキテクチャでは容易に適用できる。
論文 参考訳(メタデータ) (2022-06-13T17:50:53Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。