論文の概要: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging
Human Expertise
- arxiv url: http://arxiv.org/abs/2312.12737v1
- Date: Wed, 20 Dec 2023 03:18:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 16:48:06.190642
- Title: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging
Human Expertise
- Title(参考訳): FSscore: 人間の専門知識を活用する機械学習ベースの合成可能性スコア
- Authors: Rebecca M. Neeser, Bruno Correia, Philippe Schwaller
- Abstract要約: Focused Synthesizability score (FSscore) はグラフアテンションネットワークを用いて二進選好に基づいて構造をランク付けする。
焦点を絞ったデータセットの微調整は、適度な性能と一般化性を示す事前訓練されたモデルよりも、これらの化学スコープの性能を向上させる。
- 参考スコア(独自算出の注目度): 0.7917874428066525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining whether a molecule can be synthesized is crucial for many aspects
of chemistry and drug discovery, allowing prioritization of experimental work
and ranking molecules in de novo design tasks. Existing scoring approaches to
assess synthetic feasibility struggle to extrapolate to out-of-distribution
chemical spaces or fail to discriminate based on minor differences such as
chirality that might be obvious to trained chemists. This work aims to address
these limitations by introducing the Focused Synthesizability score (FSscore),
which learns to rank structures based on binary preferences using a graph
attention network. First, a baseline trained on an extensive set of
reactant-product pairs is established that subsequently is fine-tuned with
expert human feedback on a chemical space of interest. Fine-tuning on focused
datasets improves performance on these chemical scopes over the pre-trained
model exhibiting moderate performance and generalizability. This enables
distinguishing hard- from easy-to-synthesize molecules and improving the
synthetic accessibility of generative model outputs. On very complex scopes
with limited labels achieving satisfactory gains remains challenging. The
FSscore showcases how human expert feedback can be utilized to optimize the
assessment of synthetic feasibility for a variety of applications.
- Abstract(参考訳): 分子が合成できるかどうかを決定することは、化学と薬物発見の多くの面において重要であり、実験の優先順位付けとデ・ノボの設計タスクにおける分子のランク付けを可能にする。
既存のスコア付け手法は、分布外化学空間への外挿や、訓練された化学者にとって明らかなキラリティーのような小さな違いに基づく判別に失敗したりする。
本研究の目的は、グラフアテンションネットワークを用いて、二項選好に基づいて構造をランク付けするFocusted Synthesizability score (FSscore)を導入することにより、これらの制限に対処することである。
まず、一連の反応物-生成物ペアで訓練されたベースラインが確立され、その後、興味のある化学空間に対する専門家のフィードバックによって微調整される。
焦点を絞ったデータセットの微調整は、適度なパフォーマンスと一般化性を示す事前訓練されたモデルよりも、これらの化学領域のパフォーマンスを向上させる。
これにより、難しい分子と合成しやすい分子を区別し、生成モデル出力の合成アクセシビリティを向上させることができる。
限られたラベルで十分な利益を得る非常に複雑なスコープでは、依然として困難である。
fsscoreは、さまざまなアプリケーションに対する合成実現可能性の評価を最適化するために、人間のエキスパートフィードバックをどのように利用できるかを示す。
関連論文リスト
- SDDBench: A Benchmark for Synthesizable Drug Design [31.739548311094843]
分子合成性を評価するための新しいデータ駆動計量を提案する。
提案したラウンドトリップスコアを用いて,分子の合成経路の実現可能性を直接評価する。
提案手法の有効性を示すため, 分子生成モデルを用いて, 探索成功率とともに, ラウンドトリップスコアの総合評価を行う。
論文 参考訳(メタデータ) (2024-11-13T03:08:33Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - PRESTO: Progressive Pretraining Enhances Synthetic Chemistry Outcomes [33.293741487835824]
MLLM(Multimodal Large Language Models)は、様々な科学分野において普及している。
しかし、現在のアプローチは化学反応を理解する上での複数の分子グラフ相互作用の重要な役割を無視することが多い。
PRESTOは、事前学習戦略とデータセット構成の包括的なベンチマークを統合することで、分子-テキストのモダリティギャップを橋渡しする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-19T03:59:46Z) - Leap: molecular synthesisability scoring with intermediates [0.0]
薬物発見における一般的なアプローチは、合成アクセス可能な中間体を取り巻く化学空間を探索することである。
Leapは予測合成経路の深さ、または長い直線経路に基づいて訓練されたGPT-2モデルである。
本稿では,合成可能な分子の同定において,LeapがAUCスコアの少なくとも5%を越えていることを示す。
論文 参考訳(メタデータ) (2024-03-14T11:53:35Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。
我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。
このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文 参考訳(メタデータ) (2023-01-06T14:22:43Z) - Differentiable Scaffolding Tree for Molecular Optimization [47.447362691543304]
本稿では,離散的な化学構造を局所的な微分可能木に変換するための知識ネットワークを用いた微分可能な足場木(DST)を提案する。
実験により, 勾配に基づく分子最適化は有効であり, 試料効率が高いことが示された。
論文 参考訳(メタデータ) (2021-09-22T01:16:22Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。