論文の概要: ChemSpaceAL: An Efficient Active Learning Methodology Applied to
Protein-Specific Molecular Generation
- arxiv url: http://arxiv.org/abs/2309.05853v1
- Date: Mon, 11 Sep 2023 22:28:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 15:00:42.523130
- Title: ChemSpaceAL: An Efficient Active Learning Methodology Applied to
Protein-Specific Molecular Generation
- Title(参考訳): ChemSpaceal:タンパク質特異的分子生成に適用した効率的な能動的学習手法
- Authors: Gregory W. Kyro, Anton Morgunov, Rafael I. Brent, Victor S. Batista
- Abstract要約: 本稿では、生成モデルの微調整を可能にする、新規で効率的な半教師付き能動的学習手法を提案する。
目的とする分子生成の文脈において,GPTに基づく分子発生器を,魅力的な相互作用に基づくスコアリング機能に対して微調整できることを実証する。
我々のアプローチでは、微調整に使用されるすべてのデータポイントを個別に評価する必要はなく、計算に高価なメトリクスを組み込むことが可能である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The incredible capabilities of generative artificial intelligence models have
inevitably led to their application in the domain of drug discovery. It is
therefore of tremendous interest to develop methodologies that enhance the
abilities and applicability of these powerful tools. In this work, we present a
novel and efficient semi-supervised active learning methodology that allows for
the fine-tuning of a generative model with respect to an objective function by
strategically operating within a constructed representation of the sample
space. In the context of targeted molecular generation, we demonstrate the
ability to fine-tune a GPT-based molecular generator with respect to an
attractive interaction-based scoring function by strategically operating within
a chemical space proxy, thereby maximizing attractive interactions between the
generated molecules and a protein target. Importantly, our approach does not
require the individual evaluation of all data points that are used for
fine-tuning, enabling the incorporation of computationally expensive metrics.
We are hopeful that the inherent generality of this methodology ensures that it
will remain applicable as this exciting field evolves. To facilitate
implementation and reproducibility, we have made all of our software available
through the open-source ChemSpaceAL Python package.
- Abstract(参考訳): 生成する人工知能モデルの驚くべき能力は、必然的に薬物発見の分野への応用に繋がった。
したがって、これらの強力なツールの能力と適用性を高める方法論を開発することは、非常に興味深いことである。
本稿では,サンプル空間の構成表現内で戦略的に動作することにより,目的関数に対する生成モデルの微調整を可能にする,新規で効率的な半教師付きアクティブラーニング手法を提案する。
標的分子発生の文脈において、化学空間プロキシ内で戦略的に動作することにより、gptベースの分子発生器とタンパク質標的との魅力的な相互作用を最大化することにより、魅力的な相互作用に基づくスコアリング機能とを微調整する能力を示す。
重要なことは、我々の手法は微調整に使用されるすべてのデータポイントを個別に評価する必要がなく、計算に高価なメトリクスを組み込むことが可能である。
我々は、この方法論の本質的な一般化が、このエキサイティングな分野が発展するにつれて適用され続けることを確実にすることを期待している。
実装と再現性を容易にするため、私たちはChemSpaceAL Pythonパッケージを通じてすべてのソフトウェアを利用可能にしました。
関連論文リスト
- Active Learning Enables Extrapolation in Molecular Generative Models [11.234291560423943]
分子生成モデルのための能動的学習・閉ループ分子生成パイプラインを作成する。
他の生成モデルアプローチと比較して、我々のアクティブな学習アプローチだけがトレーニングデータを超える性質を持つ分子を生成する。
生成する安定分子の割合は、次のベストモデルよりも3.5倍高い。
論文 参考訳(メタデータ) (2025-01-03T19:07:06Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Mol-AIR: Molecular Reinforcement Learning with Adaptive Intrinsic Rewards for Goal-directed Molecular Generation [0.0]
Mol-AIRは、ゴール指向分子生成のための適応型固有報酬を用いた強化学習ベースのフレームワークである。
ベンチマークテストでは、Moll-AIRは所望の特性を持つ分子を生成する既存のアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-29T10:44:51Z) - FREED++: Improving RL Agents for Fragment-Based Molecule Generation by
Thorough Reproduction [33.57089414199478]
強化学習(Reinforcement Learning, RL)はドッキングスコア(DS)を報奨として分子を生成するための有望なアプローチとして登場した。
我々はFREED(arXiv:2110.01219)と呼ばれる分子生成の最近のモデルを再現し、精査し、改善する
論文 参考訳(メタデータ) (2024-01-18T09:54:19Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。