論文の概要: Uncertainty-aware reinforcement learning for chemical language models
- arxiv url: http://arxiv.org/abs/2606.24990v1
- Date: Tue, 23 Jun 2026 14:42:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:05:30.08412
- Title: Uncertainty-aware reinforcement learning for chemical language models
- Title(参考訳): 化学言語モデルのための不確実性認識強化学習
- Authors: Borja Medina, Jon Paul Janet,
- Abstract要約: 強化学習(RL)はデノボ分子設計の強力なパラダイムとなっている。
我々は、不確実性を考慮したRLにより、CLMがより堅牢な化学空間を探索できることを示す。
これは、分子のスコアを損なうことなく、より信頼性の高いヒット発見につながる。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning (RL) has become a powerful paradigm for de novo molecular design, enabling Chemical Language Models (CLMs) to navigate and explore the chemical space while optimizing specific desired properties. However, the existing RL frameworks treat all scoring functions as deterministic oracles, neglecting the inherent uncertainty attached to the predictions of the different molecular properties. This can lead to the exploration of highly-uncertain regions of the chemical space, focusing on the generation of highly scored molecules which are poorly supported by the training data. This can destabilize the optimization process, yielding predictions that are far from their true values. We propose and compare two complementary ways of incorporating predictive uncertainty into RL. In the first one, uncertainty is treated as an additional optimization objective and incorporated along with the rest of the scoring functions, allowing the policy to trade off exploitation against reliability. Secondly, uncertainty is used to modulate policy updates, reducing the influence of molecules whose properties lie far outside the scoring function confidence domain. Both approaches were evaluated across three different settings: (i) a controlled model system, in which the prediction error is modeled as a Gaussian distribution, with a variance proportional to the distance to the training data; and two real-world tasks, making use of (ii) ChemProp models and (iii) a Conformal Prediction wrapper applied to a Random forest classifier. We show that uncertainty-aware RL enables CLMs to explore chemical space more robustly by favoring lower-uncertainty regions. This leads to more reliable hit discovery without compromising molecular score, increasing the true hit rate by 0.25 (from 0.5 to 0.75), and nearly doubling the total number of true hits.
- Abstract(参考訳): 強化学習(RL)はデ・ノボ分子設計の強力なパラダイムとなり、化学言語モデル(CLM)が化学空間を探索し、特定の望ましい特性を最適化することを可能にする。
しかし、既存のRLフレームワークは全てのスコアリング関数を決定論的オラクルとして扱い、異なる分子特性の予測に付随する固有の不確実性を無視している。
このことは、化学空間の高度に不確実な領域の探索につながり、訓練データによって不十分な高度に測定された分子の生成に焦点をあてる。
これにより最適化プロセスが不安定になり、真の値からは程遠い予測が得られる。
予測不確実性をRLに組み込む2つの相補的な方法を提案し,比較する。
第一に、不確実性は追加の最適化目標として扱われ、他のスコアリング機能とともに組み込まれ、信頼性に対するエクスプロイトの取り消しを可能にする。
第二に、不確実性はポリシーの更新を調節し、評価関数信頼領域のはるかに外にある性質を持つ分子の影響を減らすために用いられる。
どちらのアプローチも3つの異なる設定で評価された。
一 予測誤差を訓練データの距離に比例したガウス分布としてモデル化した制御モデルシステム及び実世界の2つの課題
(二)ChemPropモデル及び
三 ランダム森林分類器に適用する等角予測ラッパー
我々は、不確実性を考慮したRLにより、CLMはより低い不確実性領域を優先して、化学空間をより堅牢に探索できることを示す。
これにより、分子のスコアを損なうことなくより信頼性の高いヒット発見が可能となり、真のヒット率を0.5から0.75に増加させ、真のヒットの総数を2倍に近くする。
関連論文リスト
- Confidence is the key: how conformal prediction enhances the generative design of permeable peptides [0.8149107671670839]
本稿では,不確実性を考慮した透過性予測器を用いて,透過性環状ペプチドを設計するRL誘導型生成フレームワークを提案する。
予測の不確実性,特に新規化学の影響に対処するため,不確実性定量法として共形予測(CP)を統合した。
論文 参考訳(メタデータ) (2026-05-07T07:01:45Z) - Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Agentic World Modeling for 6G: Near-Real-Time Generative State-Space Reasoning [70.56067503630486]
第6世代(6G)インテリジェンスは、流動的なトークン予測ではなく、想像と選択の能力を校正している、と我々は主張する。
We showed that WM-MS3M cuts mean absolute error (MAE) by 1.69% vs MS3M with 32% less parameters and similar latency, and achieve a 35-80% lower root mean squared error (RMSE) than attention/hybrid baselines with 2.3-4.1x faster inference。
論文 参考訳(メタデータ) (2025-11-04T17:22:22Z) - Model Accuracy and Data Heterogeneity Shape Uncertainty Quantification in Machine Learning Interatomic Potentials [5.955636672018519]
機械学習原子間ポテンシャル(MLIP)は正確な原子モデルを可能にするが、信頼性のある不確実性定量化(UQ)はいまだ解明されていない。
本研究では,原子クラスター拡張フレームワーク内でのアンサンブル学習とD-最適性の2つのUQ戦略について検討する。
論文 参考訳(メタデータ) (2025-08-05T12:52:49Z) - Revisiting Essential and Nonessential Settings of Evidential Deep Learning [70.82728812001807]
Evidential Deep Learning (EDL) は不確実性推定の新しい手法である。
本報告では,EDLの簡易かつ効果的な拡張型であるRe-EDLを提案する。
論文 参考訳(メタデータ) (2024-10-01T04:27:07Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Uncertainty-biased molecular dynamics for learning uniformly accurate interatomic potentials [25.091146216183144]
アクティブラーニングは、偏りや偏りのない分子動力学を用いて候補プールを生成する。
既存のバイアスやバイアスのないMDシミュレーション手法は、稀な事象や外挿領域を見逃しがちである。
この研究は、MLIPのエネルギー不確実性に偏ったMDが同時に外挿領域と稀な事象を捉えることを示した。
論文 参考訳(メタデータ) (2023-12-03T14:39:14Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。