論文の概要: Probabilistic Contrastive Pretraining for Multi-task ADME Property Prediction
- arxiv url: http://arxiv.org/abs/2606.11508v1
- Date: Tue, 09 Jun 2026 23:03:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.211505
- Title: Probabilistic Contrastive Pretraining for Multi-task ADME Property Prediction
- Title(参考訳): マルチタスクADME特性予測のための確率的コントラスト事前学習
- Authors: Yifan Xue, Srimukh Prasad Veccham, Saee Paliwal, Tyler Shimko, Micha Livne,
- Abstract要約: 吸収、分布、代謝、排ガス特性の正確な予測は、薬物発見に不可欠である。
化学固有の自己超越と対照的な相互情報機械学習(cMIM)を組み合わせた分子グラフ変換プリトレーニングフレームワークを提案する。
本手法は,分子グラフを潜伏変数にエンコードし,グラフ由来潜伏符号からSMILES文字列を再構成し,ドメイン固有の自己制御化学タスクで対照的な目的を増強する。
- 参考スコア(独自算出の注目度): 1.2070251470948772
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of absorption, distribution, metabolism, and excretion (ADME) properties is critical to drug discovery, but remains challenging because ADME endpoints are noisy, interdependent, and often data-limited. We propose a molecular graph-transformer pretraining framework that combines chemistry-specific self-supervision with contrastive mutual information machine learning (cMIM). Our method encodes molecular graphs into latent variables, reconstructs SMILES strings from the graph-derived latent codes, and augments the contrastive objective with domain-specific self-supervised chemistry tasks. Rather than treating these tasks as auxiliary regularizers with separately tuned loss weights, we formulate reconstruction, contrastive discrimination, and chemistry-specific supervision as unit-weighted log-probability factors in a single probabilistic latent-variable objective. For fine-tuning, we propose a multi-task GNN readout architecture with task-specific multilayer perceptron heads, preserving shared representation learning while mitigating negative transfer and improving the modeling of heterogeneous, nonlinear task relationships. Across Biogen, ExpansionRX, and ChEMBL-MT, the resulting Contrastive KERMT pretraining improves over the KERMT baseline by 7.6%, 9.9%, and 9.5% respectively (averaged over significantly-improved endpoints). Adding ADME-adjacent molecules to the pretraining corpus further improves transfer, and the contrastive component sharpens chemically meaningful latent neighborhoods.
- Abstract(参考訳): 正確な吸収, 分布, 代謝, 排ガス特性の予測は, 薬物発見には重要であるが, ADMEエンドポイントはノイズが多く, 相互依存的であり, しばしばデータ制限があるため, 依然として困難である。
化学固有の自己超越と対照的な相互情報機械学習(cMIM)を組み合わせた分子グラフ変換プリトレーニングフレームワークを提案する。
本手法は,分子グラフを潜伏変数にエンコードし,グラフ由来潜伏符号からSMILES文字列を再構成し,ドメイン固有の自己制御化学タスクで対照的な目的を増強する。
これらのタスクを個別に調整された損失重み付き補助正則化器として扱うのではなく、単一確率潜在変数の目的において、単位重み付き対数確率因子として再構成、対照的な識別、化学特異的監督を定式化する。
タスク固有の多層パーセプトロンヘッドを用いたマルチタスクGNN読み出しアーキテクチャを提案し、負の伝達を緩和しつつ共有表現学習を保ち、不均一で非線形なタスク関係のモデリングを改善する。
バイオゲン、エクスパンションRX、ChEMBL-MT全体で、コントラストKERMTの事前トレーニングはKERMTベースラインを7.6%、9.9%、9.5%改善した。
プレトレーニングコーパスにADME-アジャセント分子を加えると、輸送がさらに改善し、対照的な成分は化学的に有意な潜伏領域を鋭くする。
関連論文リスト
- Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.58520120011269]
本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。
CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。
本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文 参考訳(メタデータ) (2025-09-11T13:37:56Z) - Learning Flexible Forward Trajectories for Masked Molecular Diffusion [35.326540193307345]
仮面拡散モデル (MDMs) は離散データのモデリングにおいて顕著な進歩を遂げているが、分子生成におけるそのポテンシャルは未解明のままである。
標準MDMを適用すると、性能が著しく低下するという驚くべき結果が紹介される。
本研究では, 分子グラフ間の衝突を避けるため, 要素ごとの分解軌道を編成するMasked Element-wise Learnable Diffusion (MELD)を提案する。
論文 参考訳(メタデータ) (2025-05-22T15:30:17Z) - MuCoS: Efficient Drug Target Discovery via Multi Context Aware Sampling in Knowledge Graphs [0.0]
Multi Context Aware Sampling (MuCoS) は、高密度の隣人を対象にした新しいフレームワークである。
KEGG50kデータセットの実験では、MuCoSは最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-03-11T06:08:42Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Learning to Denoise Biomedical Knowledge Graph for Robust Molecular Interaction Prediction [50.7901190642594]
分子間相互作用予測のためのバイオKDN (Biomedical Knowledge Graph Denoising Network) を提案する。
BioKDNは、ノイズの多いリンクを学習可能な方法で識別することで、局所的な部分グラフの信頼性の高い構造を洗練する。
ターゲットの相互作用に関する関係を円滑にすることで、一貫性とロバストなセマンティクスを維持する。
論文 参考訳(メタデータ) (2023-12-09T07:08:00Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。