論文の概要: AtomComposer: Discovering Chemical Space from First Principles with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.28287v1
- Date: Wed, 27 May 2026 10:35:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.979002
- Title: AtomComposer: Discovering Chemical Space from First Principles with Reinforcement Learning
- Title(参考訳): AtomComposer: 強化学習による第一原理から化学空間を発見する
- Authors: Bjarke Hastrup, Francois Cornet, Tejs Vegge, Arghya Bhowmik,
- Abstract要約: AtomComposerは、統計的制約の下で有効な3D異性体を自律的に構築する自己誘導エージェントである。
我々のエージェントは、既存の単体強化学習ベースラインよりも、目に見えない試験式上で、最大で1桁有効な異性体を見つけることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Discovering novel stable molecules without training data remains a grand scientific challenge. Current molecular generative models are trained on large, pre-curated datasets, which introduce biases and limit exploration of novel chemistry. In contrast, we propose a new paradigm: autonomous, generalized agents capable of mapping vast, unknown chemical spaces without any pretraining. For the first time, we present AtomComposer, a self-guided agent that autonomously constructs valid 3D isomers under stoichiometric constraints and is trained exclusively online using reinforcement learning. Unlike existing approaches that generally overfit to a specific chemical formula, we establish a multi-composition training scheme that enables a broad generalization across diverse chemistry, guided by energy- and validity-based rewards. Our agent can discover up to an order of magnitude more valid isomers on unseen test formulas than existing single-composition reinforcement-learning baselines trained with per-step energy rewards. These results fulfill the promise of online reinforcement learning as a powerful paradigm for scalable, from-scratch exploration of chemical configuration space.
- Abstract(参考訳): トレーニングデータなしで新しい安定分子を発見することは、大きな科学的課題である。
現在の分子生成モデルは、バイアスを導入し、新しい化学の探索を制限する、大規模で事前計算されたデータセットに基づいて訓練されている。
対照的に、我々は、未知の広大な化学空間を事前訓練なしでマッピングできる自律的、一般化されたエージェントという新しいパラダイムを提案する。
AtomComposerは、統計的制約の下で有効な3D異性体を自律的に構築し、強化学習を用いてオンラインのみにトレーニングするセルフガイドエージェントである。
特定の化学式に一般的に適合する既存のアプローチとは異なり、エネルギーと妥当性に基づく報酬によって導かれる様々な化学の広範な一般化を可能にする多成分トレーニングスキームを確立する。
我々のエージェントは、ステップごとのエネルギー報酬で訓練された既存の単体強化学習ベースラインよりも、目に見えない試験式上で、最大で1桁有効な異性体を見つけることができる。
これらの結果は、化学構成空間のスケーラブルでスクラッチな探索のための強力なパラダイムとして、オンライン強化学習を約束するものである。
関連論文リスト
- Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。
ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文 参考訳(メタデータ) (2026-01-25T04:23:34Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules [19.279397111680115]
我々は、ドメイン間知識を活用して原子間相互作用の理解を深める textbfUnified bfSimulator (UniSim) を提案する。
UniSimは、小さな分子、ペプチド、タンパク質間で高い競争力を発揮する。
論文 参考訳(メタデータ) (2025-05-20T14:29:06Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。
我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。
このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文 参考訳(メタデータ) (2023-01-06T14:22:43Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Generating stable molecules using imitation and reinforcement learning [0.0]
カルテシアン座標における分子生成のための強化学習手法を提案する。
我々は、GDB-11データベース上での模倣学習から基本的な化学規則を学び、初期モデルを作成する。
次に、強化学習環境において、特定の統計量で条件付けられたモデルの複数のコピーをデプロイする。
論文 参考訳(メタデータ) (2021-07-11T10:18:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。