論文の概要: Test-Time Training Scaling Laws for Chemical Exploration in Drug Design
- arxiv url: http://arxiv.org/abs/2501.19153v2
- Date: Mon, 19 May 2025 13:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 17:08:52.040161
- Title: Test-Time Training Scaling Laws for Chemical Exploration in Drug Design
- Title(参考訳): 薬物設計における化学探査のための試験時間スケーリング法
- Authors: Morgan Thomas, Albert Bou, Gianni De Fabritiis,
- Abstract要約: 強化学習(RL)を利用した化学言語モデル(CLM)は、デ・ノボ分子設計において有望であるが、しばしばモード崩壊に悩まされている。
大規模言語モデルにおけるTTT(Test-Time Training)の着想を得て,化学空間探索の促進を目的としたスケーリングTTTを提案する。
以上の結果から, 独立RLエージェントの増加によるTTTのスケーリングは, 対数線形スケーリング法に従い, MolExp が測定した探索効率を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 3.1406146587437904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical Language Models (CLMs) leveraging reinforcement learning (RL) have shown promise in de novo molecular design, yet often suffer from mode collapse, limiting their exploration capabilities. Inspired by Test-Time Training (TTT) in large language models, we propose scaling TTT for CLMs to enhance chemical space exploration. We introduce MolExp, a novel benchmark emphasizing the discovery of structurally diverse molecules with similar bioactivity, simulating real-world drug design challenges. Our results demonstrate that scaling TTT by increasing the number of independent RL agents follows a log-linear scaling law, significantly improving exploration efficiency as measured by MolExp. In contrast, increasing TTT training time yields diminishing returns, even with exploration bonuses. We further evaluate cooperative RL strategies to enhance exploration efficiency. These findings provide a scalable framework for generative molecular design, offering insights into optimizing AI-driven drug discovery.
- Abstract(参考訳): 強化学習(RL)を利用した化学言語モデル(CLM)は、デ・ノボ分子設計において有望であるが、しばしばモード崩壊に悩まされ、探索能力が制限されている。
大規模言語モデルにおけるTTT(Test-Time Training)の着想を得て,化学空間探索の促進を目的としたスケーリングTTTを提案する。
このベンチマークでは、類似の生体活性を持つ構造的に多様な分子の発見を強調し、現実世界の薬物設計の課題をシミュレートする。
以上の結果から, 独立RLエージェントの増加によるTTTのスケーリングは, 対数線形スケーリング法に従い, MolExp が測定した探索効率を大幅に向上することを示した。
対照的に、TTトレーニング時間の増加は、探索ボーナスであってもリターンを減少させる。
さらに, 探索効率を高めるため, 協調RL戦略の評価を行った。
これらの発見は、AI駆動の薬物発見の最適化に関する洞察を提供する、生成分子設計のためのスケーラブルなフレームワークを提供する。
関連論文リスト
- InversionGNN: A Dual Path Network for Multi-Property Molecular Optimization [77.79862482208326]
InversionGNNは、多目的薬物発見のための有効だがサンプル効率のよいデュアルパスグラフニューラルネットワーク(GNN)である。
関数群の最適組み合わせに関する知識を得るために,マルチプロパティ予測のためのモデルを訓練する。
そして、学習された化学知識は、インバージョン生成経路が要求される性質を持つ分子を生成するのに役立つ。
論文 参考訳(メタデータ) (2025-03-03T12:53:36Z) - Efficient Evolutionary Search Over Chemical Space with Large Language Models [31.31899988523534]
最適化の目的は区別できない。
化学対応大規模言語モデル(LLM)を進化的アルゴリズムに導入する。
我々のアルゴリズムは最終解の質と収束速度の両方を改善する。
論文 参考訳(メタデータ) (2024-06-23T06:22:49Z) - A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics [0.0]
化学実験の結果を予測するための条件付きガウス過程モデルを提案する。
我々のモデルの新しい側面は、核がスケーリングパラメータを含み、化学空間の要素間の相関の強さを制御することである。
本稿では,化学発見の容易化と化合物の有効性に対する重要な特徴の同定のための遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-16T11:18:32Z) - ACEGEN: Reinforcement learning of generative chemical agents for drug discovery [4.966722586536789]
ACEGENは、創薬設計のための包括的で合理化されたツールキットである。
TorchRLは、完全にテストされた再利用可能なコンポーネントを提供する、現代的なRLライブラリである。
複数の薬物発見症例に応用されたACEGENの例を示す。
論文 参考訳(メタデータ) (2024-05-07T20:30:14Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Semi-Supervised GCN for learning Molecular Structure-Activity
Relationships [4.468952886990851]
そこで本稿では,半教師付き学習を用いたグラフ-グラフ間ニューラルネットワークの学習手法を提案する。
最終目標として、我々のアプローチは、アクティビティ崖、リード最適化、デノボドラッグデザインといった問題に対処するための貴重なツールとなる可能性がある。
論文 参考訳(メタデータ) (2022-01-25T09:09:43Z) - CELLS: Cost-Effective Evolution in Latent Space for Goal-Directed
Molecular Generation [23.618366377098614]
本稿では,分子潜在表現ベクトルを最適化した遅延空間におけるコスト効率のよい進化戦略を提案する。
我々は、潜伏空間と観測空間をマッピングするために、事前訓練された分子生成モデルを採用する。
提案手法といくつかの高度な手法を比較した複数の最適化タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2021-11-30T11:02:18Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。