論文の概要: IBEX: Information-Bottleneck-EXplored Coarse-to-Fine Molecular Generation under Limited Data
- arxiv url: http://arxiv.org/abs/2508.10775v1
- Date: Thu, 14 Aug 2025 15:59:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.3943
- Title: IBEX: Information-Bottleneck-EXplored Coarse-to-Fine Molecular Generation under Limited Data
- Title(参考訳): IBEX:限られたデータによるインフォメーション・ブートネック・エクスプロットによる粗結合分子生成
- Authors: Dong Xu, Zhangfan Yang, Jenna Xinyi Yao, Shuangbao Song, Zexuan Zhu, Junkai Ji,
- Abstract要約: 3次元生成モデルは構造に基づく薬物発見をますます加速させるが、公開されていないタンパク質-リガンド複合体によって制限されている。
IBEX(Information-Bottleneck-Expploed coarse-to-fine Pipeline)は,タンパク質-リガンド複合体の慢性的欠如に対処する。
- 参考スコア(独自算出の注目度): 18.780698265706945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Three-dimensional generative models increasingly drive structure-based drug discovery, yet it remains constrained by the scarce publicly available protein-ligand complexes. Under such data scarcity, almost all existing pipelines struggle to learn transferable geometric priors and consequently overfit to training-set biases. As such, we present IBEX, an Information-Bottleneck-EXplored coarse-to-fine pipeline to tackle the chronic shortage of protein-ligand complex data in structure-based drug design. Specifically, we use PAC-Bayesian information-bottleneck theory to quantify the information density of each sample. This analysis reveals how different masking strategies affect generalization and indicates that, compared with conventional de novo generation, the constrained Scaffold Hopping task endows the model with greater effective capacity and improved transfer performance. IBEX retains the original TargetDiff architecture and hyperparameters for training to generate molecules compatible with the binding pocket; it then applies an L-BFGS optimization step to finely refine each conformation by optimizing five physics-based terms and adjusting six translational and rotational degrees of freedom in under one second. With only these modifications, IBEX raises the zero-shot docking success rate on CBGBench CrossDocked2020-based from 53% to 64%, improves the mean Vina score from $-7.41 kcal mol^{-1}$ to $-8.07 kcal mol^{-1}$, and achieves the best median Vina energy in 57 of 100 pockets versus 3 for the original TargetDiff. IBEX also increases the QED by 25%, achieves state-of-the-art validity and diversity, and markedly reduces extrapolation error.
- Abstract(参考訳): 3次元生成モデルは構造に基づく薬物発見をますます加速させるが、公開されていないタンパク質-リガンド複合体によって制限されている。
このようなデータ不足の下で、既存のパイプラインのほとんどは、転送可能な幾何学的事前学習に苦労し、結果としてトレーニングセットのバイアスに過度に適合する。
IBEXは,タンパク質リガンド複合体の慢性的欠如に対処するために,インフォメーション・ボトルネック・エクスプロイトされた粗粒パイプラインである。
具体的には,各サンプルの情報密度を定量化するためにPAC-Bayesian Information-Bottleneck理論を用いる。
この分析により, マスキング戦略の違いが一般化にどのように影響するかを明らかにし, 従来のデノボ生成と比較して, 拘束されたスキャフォールドホッピングタスクは, モデルに有効容量を付与し, 転送性能を向上することを示した。
IBEXは、元のTargetDiffアーキテクチャとハイパーパラメータを保持して、結合ポケットと互換性のある分子を生成する。その後、L-BFGS最適化ステップを適用して、5つの物理ベースの用語を最適化し、6つの翻訳的および回転的自由度を1秒未満で調整することで、各コンホメーションを微調整する。
これらの修正のみで、IBEXはCBGBench CrossDocked2020ベースのゼロショットドッキング成功率を53%から64%に引き上げ、平均Vinaスコアを7.41kcal mol^{-1}$から8.07kcal mol^{-1}$に改善し、オリジナルのTargetDiffの57ポケット中3ポケットで最高の中央値のVinaエネルギーを達成する。
IBEXはまたQEDを25%向上させ、最先端の妥当性と多様性を達成し、外挿エラーを著しく低減する。
関連論文リスト
- ResCap-DBP: A Lightweight Residual-Capsule Network for Accurate DNA-Binding Protein Prediction Using Global ProteinBERT Embeddings [9.626183317998143]
本稿では,残差学習に基づくエンコーダと1次元カプセルネットワークを組み合わせた新しいディープラーニングフレームワークResCap-DBPを提案する。
ProteinBERTの埋め込みは、大きなデータセット上の他の表現を大幅に上回る。
我々のモデルは、常に現在の最先端の手法より優れています。
論文 参考訳(メタデータ) (2025-07-27T21:54:32Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Is Architectural Complexity Overrated? Competitive and Interpretable Knowledge Graph Completion with RelatE [6.959701672059059]
RelatEは、エンティティとリレーションの二重表現を効率的に統合する、解釈可能でモジュラーな方法である。
標準ベンチマークにおいて、競争力や優れたパフォーマンスを達成する。
摂動実験では、MRRはTransEと比較して最大61%、RotatEと比較して最大19%減少し、ロバスト性が改善された。
論文 参考訳(メタデータ) (2025-05-25T04:36:52Z) - Breaking the Compression Ceiling: Data-Free Pipeline for Ultra-Efficient Delta Compression [53.08742231761896]
UltraDeltaはデータフリーのデルタ圧縮パイプラインで、超高圧縮と強力なパフォーマンスを実現する。
UltraDeltaは、冗長性を最小化し、情報を最大化し、層間、層内、大域的な寸法で性能を安定させるように設計されている。
論文 参考訳(メタデータ) (2025-05-19T10:37:22Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - BoKDiff: Best-of-K Diffusion Alignment for Target-Specific 3D Molecule Generation [0.0]
構造に基づく薬物設計(SBDD)は、生体分子標的の3次元構造を利用して、新しい治療薬の開発を導く。
幾何モデルやディープラーニングを含む生成モデルの最近の進歩は、リガンド生成の最適化を約束している。
我々は,多目的最適化とBest-of-Kアライメント手法を組み合わせることで,リガンド生成を向上させる新しいフレームワークであるBoKDiffを提案する。
論文 参考訳(メタデータ) (2025-01-26T18:29:11Z) - Offline Behavior Distillation [57.6900189406964]
大規模な強化学習(RL)データは通常、インタラクションを必要とせずにポリシをオフラインにトレーニングするために収集される。
準最適RLデータから限られた専門家の行動データを合成するオフライン行動蒸留(OBD)を定式化する。
そこで本研究では, 蒸留データとオフラインデータ, ほぼ専門的ポリシーのいずれにおいても, 蒸留性能を判断的差異によって測定する2つの単純OBD目標であるDBCとPBCを提案する。
論文 参考訳(メタデータ) (2024-10-30T06:28:09Z) - TacoGFN: Target-conditioned GFlowNet for Structure-based Drug Design [3.45184803671951]
TacoGFNは、構造に基づく薬物設計のための新しいGFlowNetベースのアプローチである。
親和性と性質の報酬に比例した確率で、任意のタンパク質ポケット構造に条件付けられた分子を生成することができる。
CrossDocked 2020ベンチマークの世代別設定では、TacoGFNは中央値のVina Dockスコアで56.0%と8.44$kcal/molの最先端の成功率を達成した。
論文 参考訳(メタデータ) (2023-10-05T00:45:04Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z) - On the Difference Between the Information Bottleneck and the Deep
Information Bottleneck [81.89141311906552]
本稿では,Deep Variational Information Bottleneckとその導出に必要な仮定について再考する。
後者のマルコフ連鎖のみを満たすべき$I(T;Y)$に対して下界を最適化することで、この制限を回避する方法を示す。
論文 参考訳(メタデータ) (2019-12-31T18:31:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。