論文の概要: Generating $π$-Functional Molecules Using STGG+ with Active Learning
- arxiv url: http://arxiv.org/abs/2502.14842v1
- Date: Thu, 20 Feb 2025 18:52:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 17:44:08.745257
- Title: Generating $π$-Functional Molecules Using STGG+ with Active Learning
- Title(参考訳): STGG+とアクティブラーニングを用いた$π$-Functional Moleculesの生成
- Authors: Alexia Jolicoeur-Martineau, Yan Zhang, Boris Knyazev, Aristide Baratin, Cheng-Hao Liu,
- Abstract要約: この研究は、最先端の教師付き学習手法STGG+をアクティブな学習ループに統合する。
有機材料設計にSTGG+ALを適用する。
生成した分子は、時間依存密度汎関数理論で検証され、理化される。
- 参考スコア(独自算出の注目度): 31.421181317988093
- License:
- Abstract: Generating novel molecules with out-of-distribution properties is a major challenge in molecular discovery. While supervised learning methods generate high-quality molecules similar to those in a dataset, they struggle to generalize to out-of-distribution properties. Reinforcement learning can explore new chemical spaces but often conducts 'reward-hacking' and generates non-synthesizable molecules. In this work, we address this problem by integrating a state-of-the-art supervised learning method, STGG+, in an active learning loop. Our approach iteratively generates, evaluates, and fine-tunes STGG+ to continuously expand its knowledge. We denote this approach STGG+AL. We apply STGG+AL to the design of organic $\pi$-functional materials, specifically two challenging tasks: 1) generating highly absorptive molecules characterized by high oscillator strength and 2) designing absorptive molecules with reasonable oscillator strength in the near-infrared (NIR) range. The generated molecules are validated and rationalized in-silico with time-dependent density functional theory. Our results demonstrate that our method is highly effective in generating novel molecules with high oscillator strength, contrary to existing methods such as reinforcement learning (RL) methods. We open-source our active-learning code along with our Conjugated-xTB dataset containing 2.9 million $\pi$-conjugated molecules and the function for approximating the oscillator strength and absorption wavelength (based on sTDA-xTB).
- Abstract(参考訳): 分布外特性を持つ新規分子の生成は、分子発見の大きな課題である。
教師付き学習法はデータセットに類似した高品質な分子を生成するが、分布外特性の一般化に苦慮している。
強化学習は新しい化学空間を探索することができるが、しばしば「逆ハック」を行い、合成不可能な分子を生成する。
本研究では,最先端の教師付き学習手法STGG+をアクティブな学習ループに統合することにより,この問題に対処する。
提案手法は,STGG+を反復的に生成し,評価し,微調整することで,その知識を継続的に拡張する。
提案手法はSTGG+ALである。
有機材料設計にSTGG+ALを適用する。
1)高振動子強度と高吸収性分子の生成
2) 近赤外(NIR)範囲で適切な振動子強度を有する吸収分子を設計する。
生成した分子は、時間依存密度汎関数理論で検証され、理化される。
本手法は, 強化学習法 (RL) などの既存手法とは対照的に, 高振動子強度の新規分子の生成に有効であることを示す。
我々は,290万ドルの共役分子を含む共役xTBデータセットと,発振器強度と吸収波長(sTDA-xTBに基づく)を近似する機能を併用した能動学習コードをオープンソース化した。
関連論文リスト
- Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Context-enriched molecule representations improve few-shot drug
discovery [8.379853456273674]
数発の薬物発見のための新しい方法を提案する。
私たちの基本的な考え方は、既知のコンテキストや参照分子に関する知識によって分子表現を豊かにすることです。
本手法は,FS-Molベンチマークデータセットにおいて,薬物発見のためのいくつかの方法と比較した。
論文 参考訳(メタデータ) (2023-04-24T17:58:05Z) - Learning Harmonic Molecular Representations on Riemannian Manifold [18.49126496517951]
分子表現学習は、AIによる薬物発見研究において重要な役割を担っている。
本研究では,その分子表面のラプラス・ベルトラミ固有関数を用いた分子を表現する高調波分子表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-27T18:02:47Z) - LIMO: Latent Inceptionism for Targeted Molecule Generation [14.391216237573369]
本研究は,分子発生を極めて促進する分子発生機構であるLIMO(Latent Inceptionism on Molecules)について述べる。
総合的な実験により、LIMOはベンチマークタスクで競争力を発揮することが示された。
生成した薬物様化合物の1つが、ヒトエストロゲン受容体に対して6~14ドルのK_D$を予測している。
論文 参考訳(メタデータ) (2022-06-17T21:05:58Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - Reinforcement Learning for Molecular Design Guided by Quantum Mechanics [10.112779201155005]
分子設計のための新しいRL式を座標で提示し、構築可能な分子のクラスを拡張した。
我々の報酬関数は、高速量子化学法で近似したエネルギーのような基本的な物理的性質に基づいている。
本実験では, 翻訳および回転不変状態-作用空間で作業することで, エージェントがスクラッチからこれらの課題を効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-02-18T16:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。