論文の概要: QSAR-Guided Generative Framework for the Discovery of Synthetically Viable Odorants
- arxiv url: http://arxiv.org/abs/2512.23080v1
- Date: Sun, 28 Dec 2025 21:06:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.356886
- Title: QSAR-Guided Generative Framework for the Discovery of Synthetically Viable Odorants
- Title(参考訳): 合成生臭気の発見のためのQSAR誘導生成フレームワーク
- Authors: Tim C. Pearce, Ahmed Ibrahim,
- Abstract要約: 生成人工知能は、テクスタイドノボ分子設計に有望なアプローチを提供する。
本稿では, 可変オートエンコーダ(VAE)と定量的構造活性相関モデル(QSAR)を組み合わせることで, 新規な臭気を発生させるフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.39318191265352187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The discovery of novel odorant molecules is key for the fragrance and flavor industries, yet efficiently navigating the vast chemical space to identify structures with desirable olfactory properties remains a significant challenge. Generative artificial intelligence offers a promising approach for \textit{de novo} molecular design but typically requires large sets of molecules to learn from. To address this problem, we present a framework combining a variational autoencoder (VAE) with a quantitative structure-activity relationship (QSAR) model to generate novel odorants from limited training sets of odor molecules. The self-supervised learning capabilities of the VAE allow it to learn SMILES grammar from ChemBL database, while its training objective is augmented with a loss term derived from an external QSAR model to structure the latent representation according to odor probability. While the VAE demonstrated high internal consistency in learning the QSAR supervision signal, validation against an external, unseen ground truth dataset (Unique Good Scents) confirms the model generates syntactically valid structures (100\% validity achieved via rejection sampling) and 94.8\% unique structures. The latent space is effectively structured by odor likelihood, evidenced by a Fréchet ChemNet Distance (FCD) of $\approx$ 6.96 between generated molecules and known odorants, compared to $\approx$ 21.6 for the ChemBL baseline. Structural analysis via Bemis-Murcko scaffolds reveals that 74.4\% of candidates possess novel core frameworks distinct from the training data, indicating the model performs extensive chemical space exploration beyond simple derivatization of known odorants. Generated candidates display physicochemical properties ....
- Abstract(参考訳): 新規な臭気分子の発見は香料や香料産業にとって鍵となるが、好適な嗅覚特性を持つ構造を特定するために広大な化学空間を効率的にナビゲートすることは大きな課題である。
生成的人工知能は、‘textit{de novo} 分子設計に有望なアプローチを提供するが、通常は学習するために大量の分子を必要とする。
この問題を解決するために, 可変オートエンコーダ (VAE) と定量的構造活性相関モデル (QSAR) を組み合わせて, 限られた匂い分子の訓練セットから新規な匂い物質を生成する枠組みを提案する。
VAEの自己教師付き学習能力により、ChemBLデータベースからSMILES文法を学習でき、トレーニング対象は外部QSARモデルから派生した損失項で拡張され、匂いの確率に応じて潜在表現を構造化する。
VAEはQSARの監視信号の学習において高い内部整合性を示したが、外部の未確認の真実データセット(Unique Good Scents)に対する検証により、モデルが構文的に有効な構造(拒絶サンプリングによる100\%の妥当性)と94.8\%のユニークな構造を生成することを確認した。
潜在空間は、Fréchet ChemNet Distance (FCD) が生成分子と既知の臭気物質の間に6.96ドルを印加したことを証明し、ChemBL塩基線に対して21.6ドルを印加した。
Bemis-Murcko の足場による構造解析により、74.4 % の候補者がトレーニングデータとは異なる新しいコアフレームワークを持っていることが明らかとなり、このモデルが既知の臭気の単純な誘導体化を超えて広範な化学空間探索を行うことを示している。
生成候補は物理化学的性質を示す。
関連論文リスト
- MolProphecy: Bridging Medicinal Chemists' Knowledge and Molecular Pre-Trained Models via a Multi-Modal Framework [21.677162643535826]
MolProphecyは、化学者のドメイン知識を分子特性予測モデルに統合するためのフレームワークである。
ChatGPTは、専門家レベルの推論と意思決定をシミュレートする仮想化学者である。
MolProphecyは4つのベンチマークデータセットで、最先端(SOTA)モデルより優れています。
論文 参考訳(メタデータ) (2025-06-26T12:51:59Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
本稿では,DiffMSを提案する。DiffMS,式制限付きエンコーダ・デコーダ生成ネットワークは,このタスクにおける最先端性能を実現する。
遅延埋め込みと分子構造をブリッジするロバストデコーダを開発するために,フィンガー構造対による拡散デコーダの事前訓練を行う。
確立されたベンチマーク実験により、DiffMSはデノボ分子生成における既存のモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Navigating the Fragrance space Via Graph Generative Models And Predicting Odors [0.2749898166276853]
我々は、匂いの複雑な景観とより広い化学空間を効率的にナビゲートし、探索するために、生成的モデリング技術一式を探索する。
従来のアプローチとは異なり、分子を生成するだけでなく、OC AUCスコア0.97で匂いの類似性を予測し、匂いのラベルを割り当てる。
論文 参考訳(メタデータ) (2025-01-30T22:00:23Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Mol-PECO: a deep learning model to predict human olfactory perception
from molecular structures [0.0]
分子構造からの嗅覚知覚を予測するため,Moll-PECOと呼ばれる深層学習モデルを開発した。
8,503分子の包括的データセットにより、モル-PECOは118の匂い記述子において0.813のエリアアンダー・ザ・レシーバー・オペレーティング・キャラクタリスティック(AUROC)を直接達成する。
我々の研究は嗅覚とメカニズムの理解と解読を促進するかもしれない。
論文 参考訳(メタデータ) (2023-05-21T10:44:02Z) - CHA2: CHemistry Aware Convex Hull Autoencoder Towards Inverse Molecular
Design [2.169755083801688]
検索空間全体を包括的に探索して、興味のある性質を持つデ・ノヴォ構造を利用することは不可能である。
この課題に対処するために、難解な探索空間を低次元の潜在体積に減らすことで、分子候補をより効果的に調べることができる。
そこで我々は,高いQEDを持つ新規分子を明らかにする効率的な方法として,高いQEDでトップ分子を取り囲む凸ホールを用いて,潜在表現におけるタイトな部分空間を抽出することを提案する。
論文 参考訳(メタデータ) (2023-02-21T21:05:31Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。