Fugu-MT 論文翻訳(概要): FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging Human Expertise

論文の概要: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging Human Expertise

arxiv url: http://arxiv.org/abs/2312.12737v1
Date: Wed, 20 Dec 2023 03:18:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-21 16:48:06.190642
Title: FSscore: A Machine Learning-based Synthetic Feasibility Score Leveraging Human Expertise
Title（参考訳）: FSscore: 人間の専門知識を活用する機械学習ベースの合成可能性スコア
Authors: Rebecca M. Neeser, Bruno Correia, Philippe Schwaller
Abstract要約: Focused Synthesizability score (FSscore) はグラフアテンションネットワークを用いて二進選好に基づいて構造をランク付けする。焦点を絞ったデータセットの微調整は、適度な性能と一般化性を示す事前訓練されたモデルよりも、これらの化学スコープの性能を向上させる。
参考スコア（独自算出の注目度）: 0.7917874428066525
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Determining whether a molecule can be synthesized is crucial for many aspects of chemistry and drug discovery, allowing prioritization of experimental work and ranking molecules in de novo design tasks. Existing scoring approaches to assess synthetic feasibility struggle to extrapolate to out-of-distribution chemical spaces or fail to discriminate based on minor differences such as chirality that might be obvious to trained chemists. This work aims to address these limitations by introducing the Focused Synthesizability score (FSscore), which learns to rank structures based on binary preferences using a graph attention network. First, a baseline trained on an extensive set of reactant-product pairs is established that subsequently is fine-tuned with expert human feedback on a chemical space of interest. Fine-tuning on focused datasets improves performance on these chemical scopes over the pre-trained model exhibiting moderate performance and generalizability. This enables distinguishing hard- from easy-to-synthesize molecules and improving the synthetic accessibility of generative model outputs. On very complex scopes with limited labels achieving satisfactory gains remains challenging. The FSscore showcases how human expert feedback can be utilized to optimize the assessment of synthetic feasibility for a variety of applications.
Abstract（参考訳）: 分子が合成できるかどうかを決定することは、化学と薬物発見の多くの面において重要であり、実験の優先順位付けとデ・ノボの設計タスクにおける分子のランク付けを可能にする。既存のスコア付け手法は、分布外化学空間への外挿や、訓練された化学者にとって明らかなキラリティーのような小さな違いに基づく判別に失敗したりする。本研究の目的は、グラフアテンションネットワークを用いて、二項選好に基づいて構造をランク付けするFocusted Synthesizability score (FSscore)を導入することにより、これらの制限に対処することである。まず、一連の反応物-生成物ペアで訓練されたベースラインが確立され、その後、興味のある化学空間に対する専門家のフィードバックによって微調整される。焦点を絞ったデータセットの微調整は、適度なパフォーマンスと一般化性を示す事前訓練されたモデルよりも、これらの化学領域のパフォーマンスを向上させる。これにより、難しい分子と合成しやすい分子を区別し、生成モデル出力の合成アクセシビリティを向上させることができる。限られたラベルで十分な利益を得る非常に複雑なスコープでは、依然として困難である。 fsscoreは、さまざまなアプリケーションに対する合成実現可能性の評価を最適化するために、人間のエキスパートフィードバックをどのように利用できるかを示す。

関連論文リスト

How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.286853421822705]
大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。 SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文参考訳（メタデータ） (2026-01-09T20:08:42Z)
A Scientific Reasoning Model for Organic Synthesis Procedure Generation [12.609346156252393]
本稿では、精密な構造化実験手順を生成できる科学的推論言語モデルQFANGを提案する。本稿では,大規模に化学知識を基盤としたチェーン・オブ・シントデータを生成する,化学誘導推論(CGR)フレームワークを提案する。 RLVR(Reinforcement Learning from Verifiable Rewards)を応用して、手続き精度をさらに向上する。
論文参考訳（メタデータ） (2025-12-15T18:55:39Z)
Efficient and Programmable Exploration of Synthesizable Chemical Space [19.94593615043411]
合成可能な化学空間内での分子発見のための効率的でプログラム可能なモデルであるPrexSynを提案する。 PrexSynは、分子特性と組み合わされた合成可能な経路の数十億規模のデータストリームで訓練されたデコーダのみのトランスフォーマーに基づいている。このプロパティベースのクエリ機能を利用することで、PrexSynはブラックボックスのオラクル関数に対して分子を効率的に最適化することができる。
論文参考訳（メタデータ） (2025-11-29T08:21:21Z)
Bridging the Plausibility-Validity Gap by Fine-Tuning a Reasoning-Enhanced LLM for Chemical Synthesis and Discovery [0.0]
大規模言語モデルはしばしば科学的に妥当だが、実際は無効な情報を生成する。本稿では, このギャップを埋める手法として, 専門的な科学アシスタントを開発する。
論文参考訳（メタデータ） (2025-07-09T23:05:23Z)
ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文参考訳（メタデータ） (2025-06-30T05:11:19Z)
Kernel Learning Assisted Synthesis Condition Exploration for Ternary Spinel [1.146645849310105]
我々は,グローバルSHAP解析の新たな応用によるカーネル分類モデルを用いて,単一相合成性に最も重要な実験特徴を特定する。グローバルSHAP分析により、単相スピネル形成への前駆体および沈殿剤の寄与は、確立された結晶成長理論と密接に一致していることが明らかとなった。
論文参考訳（メタデータ） (2025-03-25T13:28:10Z)
SDDBench: A Benchmark for Synthesizable Drug Design [31.739548311094843]
分子合成性を評価するための新しいデータ駆動計量を提案する。提案したラウンドトリップスコアを用いて,分子の合成経路の実現可能性を直接評価する。提案手法の有効性を示すため, 分子生成モデルを用いて, 探索成功率とともに, ラウンドトリップスコアの総合評価を行う。
論文参考訳（メタデータ） (2024-11-13T03:08:33Z)
BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文参考訳（メタデータ） (2024-08-19T05:17:40Z)
PRESTO: Progressive Pretraining Enhances Synthetic Chemistry Outcomes [33.293741487835824]
MLLM(Multimodal Large Language Models)は、様々な科学分野において普及している。しかし、現在のアプローチは化学反応を理解する上での複数の分子グラフ相互作用の重要な役割を無視することが多い。 PRESTOは、事前学習戦略とデータセット構成の包括的なベンチマークを統合することで、分子-テキストのモダリティギャップを橋渡しする新しいフレームワークである。
論文参考訳（メタデータ） (2024-06-19T03:59:46Z)
Leap: molecular synthesisability scoring with intermediates [0.0]
薬物発見における一般的なアプローチは、合成アクセス可能な中間体を取り巻く化学空間を探索することである。 Leapは予測合成経路の深さ、または長い直線経路に基づいて訓練されたGPT-2モデルである。本稿では,合成可能な分子の同定において,LeapがAUCスコアの少なくとも5%を越えていることを示す。
論文参考訳（メタデータ） (2024-03-14T11:53:35Z)
ChemVise: Maximizing Out-of-Distribution Chemical Detection with the Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文参考訳（メタデータ） (2023-02-09T20:19:57Z)
Discovery of structure-property relations for molecules via hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文参考訳（メタデータ） (2023-01-06T14:22:43Z)
Differentiable Scaffolding Tree for Molecular Optimization [47.447362691543304]
本稿では,離散的な化学構造を局所的な微分可能木に変換するための知識ネットワークを用いた微分可能な足場木(DST)を提案する。実験により, 勾配に基づく分子最適化は有効であり, 試料効率が高いことが示された。
論文参考訳（メタデータ） (2021-09-22T01:16:22Z)
Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。 FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文参考訳（メタデータ） (2021-09-15T12:49:13Z)
Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost Functions [80.12620331438052]
深層学習はサイリコの何十億もの分子を迅速にスクリーニングする重要なツールとなりましたその重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文参考訳（メタデータ） (2020-06-25T08:46:37Z)
Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文参考訳（メタデータ） (2020-04-26T21:40:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。