論文の概要: De novo molecular generation with optical property preconditioning at the token level
- arxiv url: http://arxiv.org/abs/2606.08221v1
- Date: Sat, 06 Jun 2026 15:16:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.980876
- Title: De novo molecular generation with optical property preconditioning at the token level
- Title(参考訳): トークンレベルでの光特性プレコンディショニングによるデノボ分子生成
- Authors: Haozhe Huang, Manuel Gonzalez Lastre, Hyun Suk Park, Jorge A. Campos-Gonzalez-Angulo, Xinjian Liu, Alán Aspuru-Guzik,
- Abstract要約: 実際の低データ状態下でのOLED分子生成のためのトークン条件付き自己回帰言語モデルをベンチマークする。
GPT2モデルは、大規模ケミカルコーパスで事前訓練され、個別のプロパティトークンで拡張され、マルチタスク最適化を用いて微調整される。
生成分子をTDDFTレベルで評価し、分布の忠実度と可制御性を評価する。
- 参考スコア(独自算出の注目度): 5.001407498158197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing OLED molecules with targeted optical properties remains challenging due to the scarcity of high-quality data and the limited reliability of conditional control in generative models across chemical motifs. Here, we benchmark a token-conditioned autoregressive language model for OLED molecular generation in a realistic low-data regime. A GPT2 model is pretrained on large chemical corpora, augmented with discrete property tokens, and fine-tuned using multi-task optimisation. Conditioning targets vertical absorption energy and oscillator strength, with the HOMO-LUMO gap included as an auxiliary electronic descriptor. Generated molecules are evaluated at the TDDFT level to assess distributional fidelity and controllability. The generated library reproduces the dominant optical-property support of the training distribution while shifting towards lower molecular weight and fewer heavy atoms. Token-level control is consistently directional across conditioning bins, but is not fully orthogonal and exhibits local calibration irregularities. A chemotype-resolved analysis further shows that controllability depends strongly on local electronic environments: moderately conjugated aromatic-carbon motifs are associated with improved joint target satisfaction, whereas electron-withdrawing motifs, particularly aryl nitriles, show systematic red-shifting and reduced controllability. These results establish a quantitative benchmark for conditional OLED molecular generation and show that model reliability must be assessed in chemically meaningful subspaces rather than from aggregate property distributions alone.
- Abstract(参考訳): 目標とする光学特性を持つOLED分子の設計は、高品質なデータの不足と、化学モチーフにまたがる生成モデルにおける条件制御の信頼性の限界により、依然として困難である。
本稿では,実際の低データ状態下でのOLED分子生成のためのトークン条件付き自己回帰言語モデルをベンチマークする。
GPT2モデルは、大規模ケミカルコーパスで事前訓練され、個別のプロパティトークンで拡張され、マルチタスク最適化を用いて微調整される。
条件付けは垂直吸収エネルギーと振動子強度を目標とし、HOMO-LUMOギャップは補助電子ディスクリプタとして含まれる。
生成分子をTDDFTレベルで評価し、分布の忠実度と可制御性を評価する。
生成されたライブラリは、より低い分子量と少ない重原子にシフトしながら、トレーニング分布の圧倒的な光学特性を再現する。
トークンレベルの制御はコンディショニング・ビン間で一貫した方向を向いているが、完全に直交せず、局所的な校正の不規則性を示す。
ケモタイプ分解分析により、制御性は局所的な電子環境に強く依存していることが明らかとなった: 適度に共役した芳香族-炭素モチーフは関節目標の満足度の改善と関連しているのに対し、電子を含まないモチーフ、特にアリルニトリルは系統的な赤方偏移と制御性低下を示す。
これらの結果は、条件付きOLED分子生成のための定量的なベンチマークを確立し、モデル信頼性は、集合特性分布のみからではなく、化学的に意味のある部分空間で評価する必要があることを示す。
関連論文リスト
- Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.58520120011269]
本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。
CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。
本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文 参考訳(メタデータ) (2025-09-11T13:37:56Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Chemistry-Inspired Diffusion with Non-Differentiable Guidance [10.573577157257564]
拡散モデルの最近の進歩は、新しい分子の条件生成に顕著な可能性を示している。
本研究では, 量子化学の領域知識を微分不可能なオラクルとして活用し, 非条件拡散モデルを導出する手法を提案する。
オラクルはニューラルネットワークに頼る代わりに、推定勾配の形で正確なガイダンスを提供し、量子化学によって指定された条件分布から拡散過程をサンプリングすることができる。
論文 参考訳(メタデータ) (2024-10-09T03:10:21Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Graph Diffusion Transformers for Multi-Conditional Molecular Generation [16.58392955245203]
多条件分子生成のためのグラフ拡散変換器(Graph DiT)を提案する。
Graph DiTはエンコーダを統合し、数値的および分類的プロパティ表現とTransformerベースのデノイザを学習する。
その結果、分布学習から分子特性の条件制御まで、9つの指標にまたがるグラフDiTの優位性が示された。
論文 参考訳(メタデータ) (2024-01-24T23:45:31Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Predicting molecular dipole moments by combining atomic partial charges
and atomic dipoles [3.0980025155565376]
高レベル結合クラスター理論を用いて計算した分子$boldsymbolmu$を再現するために、「MuML」モデルが組み合わされた。
校正委員会モデルを用いて予測の不確かさを確実に推定できることを実証する。
論文 参考訳(メタデータ) (2020-03-27T14:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。