論文の概要: Diverse Mini-Batch Selection in Reinforcement Learning for Efficient Chemical Exploration in de novo Drug Design
- arxiv url: http://arxiv.org/abs/2506.21158v1
- Date: Thu, 26 Jun 2025 11:31:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.062165
- Title: Diverse Mini-Batch Selection in Reinforcement Learning for Efficient Chemical Exploration in de novo Drug Design
- Title(参考訳): デノボ医薬品設計における効率的な化学探索のための強化学習における多変量小バッチ選択
- Authors: Hampus Gummesson Svensson, Ola Engkvist, Jon Paul Janet, Christian Tyrchan, Morteza Haghir Chehreghani,
- Abstract要約: 強化学習のための多種多様なミニバッチ選択を導入する。
我々は、この枠組みを現実世界の問題、すなわち薬物発見の文脈で研究する。
- 参考スコア(独自算出の注目度): 2.8953481239016465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many real-world applications, evaluating the goodness of instances is often costly and time-consuming, e.g., human feedback and physics simulations, in contrast to proposing new instances. In particular, this is even more critical in reinforcement learning, as new interactions with the environment (i.e., new instances) need to be evaluated to provide a reward signal to learn from. As sufficient exploration is crucial, learning from a diverse mini-batch can have a large impact and help mitigate mode collapse. In this paper, we introduce diverse mini-batch selection for reinforcement learning and propose to use determinantal point processes for this task. We study this framework in the context of a real-world problem, namely drug discovery. We experimentally study how our proposed framework can improve the effectiveness of chemical exploration in de novo drug design, where finding diverse and high-quality solutions is essential. We conduct a comprehensive evaluation with three well-established molecular generation oracles over numerous generative steps. Our experiments conclude that our diverse mini-batch selection framework can substantially improve the diversity of the solutions, while still obtaining solutions of high quality. In drug discovery, such outcome can potentially lead to fulfilling unmet medication needs faster.
- Abstract(参考訳): 多くの現実世界のアプリケーションでは、新しいインスタンスを提案するのとは対照的に、例えば人間のフィードバックや物理シミュレーションといった、インスタンスの良さを評価するのにコストがかかり、時間がかかります。
特に、環境との新たな相互作用(すなわち、新しいインスタンス)を評価し、そこから学ぶための報酬信号を与える必要があるため、強化学習においてさらに重要である。
十分な探索が重要であるため、多様なミニバッチから学ぶことは、大きなインパクトを与え、モードの崩壊を緩和するのに役立ちます。
本稿では、強化学習のための多種多様なミニバッチ選択を導入し、このタスクに決定点プロセスを用いることを提案する。
我々は、この枠組みを現実世界の問題、すなわち薬物発見の文脈で研究する。
提案手法がド・ノボの医薬品設計における化学探査の有効性をいかに改善するかを実験的に検討した。
本研究は, 多数の生成過程において, 3つの確立された分子発生オラクルを用いて包括的評価を行う。
実験の結果,我々の多種多様なミニバッチ選択フレームワークは,高品質な解を得ながら,解の多様性を著しく向上させることができることがわかった。
薬物の発見においては、そのような結果は、未使用の医薬品のニーズを早く満たすのに繋がる可能性がある。
関連論文リスト
- Efficient Biological Data Acquisition through Inference Set Design [3.9633147697178996]
本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
本稿では,このメカニズムを推論セット設計と呼び,信頼性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T15:34:03Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z) - Biological Sequence Design with GFlowNets [75.1642973538266]
望ましい性質を持つデノボ生物配列の設計には、数ラウンドの分子のアイデアと高価なウェットラブ評価を伴う活性ループが伴うことが多い。
これにより、提案された候補の多様性は、構想段階において重要な考慮事項となる。
本稿では,不確実性推定と近年提案されているGFlowNetを多種多様な候補解の生成元として活用した能動的学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-02T15:53:38Z) - Nonmyopic Multiclass Active Search for Diverse Discovery [23.752202199551572]
アクティブサーチは適応的な実験設計の舞台であり、予算制約を受ける希少で価値のあるクラスのメンバーを明らかにすることを目的としている。
本稿では,複数の対象クラスを対象とする能動探索の新たな定式化について述べる。
論文 参考訳(メタデータ) (2022-02-08T01:39:02Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。