論文の概要: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging
Human Expertise
- arxiv url: http://arxiv.org/abs/2312.12737v1
- Date: Wed, 20 Dec 2023 03:18:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 16:48:06.190642
- Title: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging
Human Expertise
- Title(参考訳): FSscore: 人間の専門知識を活用する機械学習ベースの合成可能性スコア
- Authors: Rebecca M. Neeser, Bruno Correia, Philippe Schwaller
- Abstract要約: Focused Synthesizability score (FSscore) はグラフアテンションネットワークを用いて二進選好に基づいて構造をランク付けする。
焦点を絞ったデータセットの微調整は、適度な性能と一般化性を示す事前訓練されたモデルよりも、これらの化学スコープの性能を向上させる。
- 参考スコア(独自算出の注目度): 0.7917874428066525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining whether a molecule can be synthesized is crucial for many aspects
of chemistry and drug discovery, allowing prioritization of experimental work
and ranking molecules in de novo design tasks. Existing scoring approaches to
assess synthetic feasibility struggle to extrapolate to out-of-distribution
chemical spaces or fail to discriminate based on minor differences such as
chirality that might be obvious to trained chemists. This work aims to address
these limitations by introducing the Focused Synthesizability score (FSscore),
which learns to rank structures based on binary preferences using a graph
attention network. First, a baseline trained on an extensive set of
reactant-product pairs is established that subsequently is fine-tuned with
expert human feedback on a chemical space of interest. Fine-tuning on focused
datasets improves performance on these chemical scopes over the pre-trained
model exhibiting moderate performance and generalizability. This enables
distinguishing hard- from easy-to-synthesize molecules and improving the
synthetic accessibility of generative model outputs. On very complex scopes
with limited labels achieving satisfactory gains remains challenging. The
FSscore showcases how human expert feedback can be utilized to optimize the
assessment of synthetic feasibility for a variety of applications.
- Abstract(参考訳): 分子が合成できるかどうかを決定することは、化学と薬物発見の多くの面において重要であり、実験の優先順位付けとデ・ノボの設計タスクにおける分子のランク付けを可能にする。
既存のスコア付け手法は、分布外化学空間への外挿や、訓練された化学者にとって明らかなキラリティーのような小さな違いに基づく判別に失敗したりする。
本研究の目的は、グラフアテンションネットワークを用いて、二項選好に基づいて構造をランク付けするFocusted Synthesizability score (FSscore)を導入することにより、これらの制限に対処することである。
まず、一連の反応物-生成物ペアで訓練されたベースラインが確立され、その後、興味のある化学空間に対する専門家のフィードバックによって微調整される。
焦点を絞ったデータセットの微調整は、適度なパフォーマンスと一般化性を示す事前訓練されたモデルよりも、これらの化学領域のパフォーマンスを向上させる。
これにより、難しい分子と合成しやすい分子を区別し、生成モデル出力の合成アクセシビリティを向上させることができる。
限られたラベルで十分な利益を得る非常に複雑なスコープでは、依然として困難である。
fsscoreは、さまざまなアプリケーションに対する合成実現可能性の評価を最適化するために、人間のエキスパートフィードバックをどのように利用できるかを示す。
関連論文リスト
- Holistic chemical evaluation reveals pitfalls in reaction prediction
models [0.3065062372337749]
本稿では, より総合的な評価をめざして, 現状のアプローチに基づく新たな評価手法を提案する。
ChoRISOは、化学的に関連するシナリオを再現するために、複数の調整された分割と共に、キュレートされたデータセットである。
私たちの研究は、最終的に化学発見を加速できる堅牢な予測モデルへの道を開いた。
論文 参考訳(メタデータ) (2023-12-14T14:54:28Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。
我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。
このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文 参考訳(メタデータ) (2023-01-06T14:22:43Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。