論文の概要: REINFORCE-ING Chemical Language Models in Drug Design
- arxiv url: http://arxiv.org/abs/2501.15971v1
- Date: Mon, 27 Jan 2025 11:30:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:55:18.856089
- Title: REINFORCE-ING Chemical Language Models in Drug Design
- Title(参考訳): 医薬品設計におけるReINFORCE-INGケミカル言語モデル
- Authors: Morgan Thomas, Albert Bou, Gianni De Fabritiis,
- Abstract要約: RLアルゴリズムは, 医薬品設計において, 大規模化学空間を効率よく横切ることができることを示す。
本稿では,RL理論とRL理論の相違点として,経験的リプレイ,ヒルクライミング,ベースラインの影響について検討した。
- 参考スコア(独自算出の注目度): 3.1406146587437904
- License:
- Abstract: Chemical language models, combined with reinforcement learning, have shown significant promise to efficiently traverse large chemical spaces in drug design. However, the performance of various RL algorithms and their best practices for practical drug design are still unclear. Here, starting from the principles of the REINFORCE algorithm, we investigate the effect of different components from RL theory including experience replay, hill-climbing, baselines to reduce variance, and alternative reward shaping. Additionally we demonstrate how RL hyperparameters can be fine-tuned for effectiveness, efficiency, or chemical regularization as demonstrated using the MolOpt benchmark.
- Abstract(参考訳): 化学言語モデルと強化学習が組み合わさって、医薬品設計において大きな化学空間を効率的に横断する大きな可能性を示してきた。
しかし, 様々なRLアルゴリズムの性能と医薬設計のベストプラクティスはいまだに不明である。
本稿では、REINFORCEアルゴリズムの原理から、経験的リプレイ、ヒルクライミング、分散低減のためのベースライン、代替報酬形成など、RL理論と異なる要素の効果について検討する。
さらに,MollOptベンチマークで示すように,RLハイパーパラメータを,有効性,効率,化学正則化のために微調整できることを示す。
関連論文リスト
- Equivariant Graph Attention Networks with Structural Motifs for Predicting Cell Line-Specific Synergistic Drug Combinations [0.0]
がんは2番目の死因であり、化学療法が主要な治療法の1つである。
現在、インビトロやインビトロのような薬物併用スクリーニングの方法は、スターク時間と金銭的コストのために非効率である。
3次元回転, 翻訳, リフレクションと構造モチーフの同値なグラフアテンションネットワークを用いた幾何学的深層学習モデルを用いる。
論文 参考訳(メタデータ) (2024-11-07T14:29:05Z) - Pathway-Guided Optimization of Deep Generative Molecular Design Models for Cancer Therapy [1.8210200978176423]
ジャンクションツリー変動オートエンコーダ (JTVAE) は効率的な生成モデルであることが示されている。
薬物様小分子の治療効果を評価する薬理力学モデルが, 有効潜時空間最適化にどのように組み込まれているかを示す。
論文 参考訳(メタデータ) (2024-11-05T19:20:30Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [50.639325453203504]
MM-RCRは、化学反応レコメンデーション(RCR)のためのSMILES、反応グラフ、テキストコーパスから統一的な反応表現を学習するテキスト拡張マルチモーダルLLMである。
この結果から,MM-RCRは2つのオープンベンチマークデータセット上で最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-07-21T12:27:26Z) - Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.31328039424469]
このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。
PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文 参考訳(メタデータ) (2024-07-18T17:35:32Z) - ACEGEN: Reinforcement learning of generative chemical agents for drug discovery [4.966722586536789]
ACEGENは、創薬設計のための包括的で合理化されたツールキットである。
TorchRLは、完全にテストされた再利用可能なコンポーネントを提供する、現代的なRLライブラリである。
複数の薬物発見症例に応用されたACEGENの例を示す。
論文 参考訳(メタデータ) (2024-05-07T20:30:14Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - ChemGymRL: An Interactive Framework for Reinforcement Learning for
Digital Chemistry [2.350237106287331]
本稿では,化学発見にRL(Reinforcement Learning)を応用するための模擬実験室を提供する。
RLは、かなりデータ集約型であるため、実世界での行動をとる訓練エージェントは、実現不可能であり、危険である可能性がある。
我々は、標準のOpen AI Gymテンプレートに基づいて、高度にカスタマイズ可能でオープンソースのRL環境であるChemGymRLを紹介します。
論文 参考訳(メタデータ) (2023-05-23T15:56:17Z) - Learning to Prune Deep Neural Networks via Reinforcement Learning [64.85939668308966]
PuRLは、ニューラルネットワークのプルーニングのためのディープ強化学習ベースのアルゴリズムである。
現在の最先端の手法に匹敵する幅と精度を実現している。
論文 参考訳(メタデータ) (2020-07-09T13:06:07Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。