論文の概要: Multitask finetuning and acceleration of chemical pretrained models for small molecule drug property prediction
- arxiv url: http://arxiv.org/abs/2510.12719v1
- Date: Tue, 14 Oct 2025 16:58:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.404031
- Title: Multitask finetuning and acceleration of chemical pretrained models for small molecule drug property prediction
- Title(参考訳): 小分子の薬物特性予測のための化学事前訓練モデルのマルチタスク微調整と加速
- Authors: Matthew Adrian, Yunsie Chung, Kevin Boyd, Saee Paliwal, Srimukh Prasad Veccham, Alan C. Cheng,
- Abstract要約: マルチタスク学習は以前,予測モデルの改善に成功している。
ケミカルプレトレーニンググラフニューラルネットワークモデルの微調整におけるマルチタスキングの実現により,性能が著しく向上することを示す。
我々は2つのマルチタスクADMETデータ分割を公開し、薬物特性予測のためのマルチタスク深層学習手法のより正確なベンチマークを可能にする。
- 参考スコア(独自算出の注目度): 1.1391158217994781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical pretrained models, sometimes referred to as foundation models, are receiving considerable interest for drug discovery applications. The general chemical knowledge extracted from self-supervised training has the potential to improve predictions for critical drug discovery endpoints, including on-target potency and ADMET properties. Multi-task learning has previously been successfully leveraged to improve predictive models. Here, we show that enabling multitasking in finetuning of chemical pretrained graph neural network models such as Kinetic GROVER Multi-Task (KERMT), an enhanced version of the GROVER model, and Knowledge-guided Pre-training of Graph Transformer (KGPT) significantly improves performance over non-pretrained graph neural network models. Surprisingly, we find that the performance improvement from finetuning KERMT in a multitask manner is most significant at larger data sizes. Additionally, we publish two multitask ADMET data splits to enable more accurate benchmarking of multitask deep learning methods for drug property prediction. Finally, we provide an accelerated implementation of the KERMT model on GitHub, unlocking large-scale pretraining, finetuning, and inference in industrial drug discovery workflows.
- Abstract(参考訳): 化学事前訓練されたモデル(しばしば基礎モデルと呼ばれる)は、薬物発見の応用にかなりの関心を集めている。
自己監督訓練から抽出された一般的な化学知識は、標的の有効性やADMET特性を含む重要な薬物発見エンドポイントの予測を改善する可能性がある。
マルチタスク学習は以前,予測モデルの改善に成功している。
本稿では,KERMT (Kineetic GROVER Multi-Task) やGROVERモデルの強化版,KGPT (Knowledge-guided Pre-training of Graph Transformer) などの化学事前学習型グラフニューラルネットワークモデルの微調整におけるマルチタスクの実現により,非事前学習型グラフニューラルネットワークモデルの性能が大幅に向上することを示す。
驚いたことに、KERMTのマルチタスク方式による微調整による性能改善は、より大きなデータサイズにおいて最も重要である。
さらに、2つのマルチタスクADMETデータ分割を公開し、薬物特性予測のためのマルチタスク深層学習手法のより正確なベンチマークを可能にする。
最後に、GitHub上でKERMTモデルの迅速な実装を提供し、産業用薬物発見ワークフローにおける大規模な事前トレーニング、微調整、推論を可能にします。
関連論文リスト
- MEPT: Mixture of Expert Prompt Tuning as a Manifold Mapper [75.6582687942241]
本稿では,Mixture of Expert Prompt Tuning (MEPT) を効果的かつ効率的な多様体マッピングフレームワークとして提案する。
MEPTは複数のプロンプト専門家を統合し、多様な非定常データ分布を適応的に学習する。
経験的評価により、MEPTはSuperGLUE上でいくつかの最先端パラメータの効率的なベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2025-08-31T21:19:25Z) - All You Need Is Synthetic Task Augmentation [0.0]
本研究では,1つのグラフトランスフォーマーニューラルネットワークを,スパースマルチタスク分子特性実験ターゲットと合成ターゲットの両方で協調的にトレーニングする新しい手法を提案する。
その結果,19の分子特性予測タスクにおいて,一貫した,重要な性能向上が得られた。
論文 参考訳(メタデータ) (2025-05-15T09:46:27Z) - DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks [61.16389024252561]
計算資源と限られた訓練データとの制約下で複数のタスクに対処できる頑健な一般認識モデルを構築した。
我々は、何十億もの画像に事前訓練されたテキスト・画像拡散モデルを活用し、ビジュアル・ジェネラリスト・モデルであるDICEPTIONの導入に成功した。
DICEPTIONは、SOTAシングルタスクスペシャリストモデルに匹敵するパフォーマンスを達成しつつ、様々な知覚タスクに効果的に取り組むことを示す。
論文 参考訳(メタデータ) (2025-02-24T13:51:06Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - Does GNN Pretraining Help Molecular Representation? [5.5459878275267736]
自己教師付きグラフ事前学習は、多くの設定において非事前学習法に対して統計的に有意な優位性を持たない。
追加の教師付き事前トレーニングでは改善が観察できるが、よりリッチな機能やバランスの取れたデータ分割によって改善は減少する可能性がある。
我々は、分子の事前学習の複雑さが不十分であり、下流のタスクに対する伝達可能な知識が少なくなると仮定する。
論文 参考訳(メタデータ) (2022-07-13T07:34:16Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Unsupervised Pre-Training on Patient Population Graphs for Patient-Level
Predictions [48.02011627390706]
プレトレーニングは、コンピュータビジョン(CV)、自然言語処理(NLP)、医療画像など、機械学習のさまざまな分野で成功している。
本稿では,患者結果の予測のために,教師なし事前学習を異種マルチモーダルEHRデータに適用する。
提案手法は,人口レベルでのデータモデリングに有効であることがわかった。
論文 参考訳(メタデータ) (2022-03-23T17:59:45Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。