論文の概要: Margin-calibrated Classifier Guidance for Property-driven Synthesis Planning
- arxiv url: http://arxiv.org/abs/2605.13101v1
- Date: Wed, 13 May 2026 07:12:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.870541
- Title: Margin-calibrated Classifier Guidance for Property-driven Synthesis Planning
- Title(参考訳): プロパティ駆動型合成計画のためのマージン校正型分類法
- Authors: Najwa Laabid, Vikas Garg,
- Abstract要約: 比較的議論とマージンに基づく損失を利用して分類器の校正を行うSCR(Sequence Completion Ranking)を導入する。
SCRはマルチステップ解決率を16.8%ドル(無誘導発電機)から78.4%ドル(反応型誘導)、9.3%ドル(谷本誘導)に大幅に改善している。
また,テンプレートフリー手法とテンプレートベース手法の長期的多様性ギャップを効果的に解消する。
- 参考スコア(独自算出の注目度): 23.782236689125995
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthesis planning seeks an efficient sequence of chemical reactions that produce a target molecule. Typically, a pretrained single-step (autoregressive) retrosynthesis model is repeatedly invoked to generate such a sequence. Classifier guidance can, in principle, help steer the output of single-step model toward reactions that satisfy specific constraints or accommodate chemist's preferences during inference without having to retrain the autoregressive generator. We expose the insufficiency of auxiliary classifiers trained with cross-entropy loss to override the unconditional token-level distributions learned from typical sparse single-disconnection reaction datasets. We overcome this issue with a novel method called Sequence Completion Ranking (SCR), which employs contrastive argumentation and a margin-based loss to calibrate the classifier so that it can meaningfully discriminate between continuations during decoding. We formally establish that margin-calibrated classifiers can expand the set of property-satisfying sequences reachable under guided beam search. Empirically, on USPTO-190, given chemist-specified guidance targets, SCR substantially improves multi-step solve rates from $16.8\%$ (unguided generator) to $78.4\%$ with reaction-type guidance and $95.3\%$ with Tanimoto guidance, unlocking valid routes for 33 targets ($17.4\%$) previously unsolvable with baselines. Our method also effectively closes the long-standing diversity gap between template-free and template-based methods.
- Abstract(参考訳): 合成計画では、標的分子を生成する化学反応の効率的なシーケンスを求める。
通常、事前訓練された単一ステップ(自己回帰)レトロシンセシスモデルが繰り返し起動され、そのようなシーケンスが生成される。
分類法指導は、原則として、単段階モデルの出力を特定の制約を満たす反応に向けて操縦したり、自動回帰生成装置を再訓練することなく、推論中に化学者の嗜好を満足させるのに役立つ。
クロスエントロピー損失を訓練した補助的分類器が、典型的なスパース単一切断反応データセットから学習した無条件のトークンレベルの分布をオーバーライドするために、不十分であることを明らかにする。
この問題は、競合的議論とマージンに基づく損失を利用して、復号時の継続を有意に識別できるように分類器を校正する、SCR(Sequence Completion Ranking)と呼ばれる新しい手法で克服する。
我々は、マージン校正された分類器が、ガイドビームサーチの下で到達可能なプロパティ満足シーケンスの集合を拡張することを正式に確立する。
USPTO-190では、化学者が特定した誘導目標が与えられた場合、SCRは反応型誘導で16.8 %$(無誘導発電機)から78.4 %$(タニモト誘導で9.3 %$)に大幅に改善し、33 の目標に対して有効なルートをアンロックする(17.4 %$)。
また,テンプレートフリー手法とテンプレートベース手法の長期的多様性ギャップを効果的に解消する。
関連論文リスト
- DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments [47.61857875238484]
我々はトンプソンサンプリング(DARTS)による動的適応的ランダム化を導入する。
DARTSは、共変量取得を設計に基づく因果推論タスクに埋め込まれた逐次最適化問題として扱う。
我々は,最小限の値と対数的因子とを一致させる獲得層に対してベイズリスクを導出する。
論文 参考訳(メタデータ) (2026-05-07T17:27:51Z) - Test-Time Scaling with Diffusion Language Models via Reward-Guided Stitching [66.39914384073145]
本稿では,安価な拡散サンプリング推論をステップレベル候補の再利用プールに変換する自己整合性フレームワークを提案する。
ステップレベルの再結合は、難しい問題に対して最も有益であることがわかった。
トレーニング不要のフレームワークは、6つの数学およびコーディングタスクの平均精度を最大2倍改善します。
論文 参考訳(メタデータ) (2026-02-26T11:08:39Z) - Why Self-Training Helps and Hurts: Denoising vs. Signal Forgetting [6.369253528507392]
反復的な自己学習は、自身の予測によって生成された擬似ラベルのモデルに繰り返し適合する。
繰り返しの予測リスクと有効雑音に対する決定論的等価再帰を導出する。
論文 参考訳(メタデータ) (2026-02-15T07:28:12Z) - Provably Reliable Classifier Guidance via Cross-Entropy Control [4.298880233819988]
拡散モデルの各ステップにおけるクロスエントロピー損失は、対応する誘導誤差を制御するのに十分であることを示す。
その結果,サンプリング誤差ベクトル誘導拡散モデル上界が得られ,逆対数ソボレフ型不等式に類似していることがわかった。
論文 参考訳(メタデータ) (2026-01-29T02:59:04Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Classifier Calibration with ROC-Regularized Isotonic Regression [0.0]
等方性回帰を用いてモノトン変換による校正集合上のクロスエントロピーを最小化する。
IRは適応的なバイナリ処理として機能し、キャリブレーション誤差をゼロにすることができるが、性能への影響は未解決である。
この一般単調な基準は、クロスエントロピー損失の低減と校正セットの過度な適合の回避のバランスを打つのに有効であることを示す。
論文 参考訳(メタデータ) (2023-11-21T08:45:09Z) - Low-Rank Tensor Completion via Novel Sparsity-Inducing Regularizers [30.920908325825668]
低ランクテンソル完備化問題において、l1-ノルムを緩和するため、非ランクサロゲート/正則化器が提案されている。
これらの正則化器は核ランク復元に適用され,乗算器法に基づく効率的なアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2023-10-10T01:00:13Z) - SequenceMatch: Imitation Learning for Autoregressive Sequence Modelling with Backtracking [60.109453252858806]
MLE(Maxum-likelihood)の目的は、高品質なシーケンスを自動回帰的に生成する下流のユースケースと一致しない。
我々は、模倣学習(IL)問題としてシーケンス生成を定式化する。
これにより、自己回帰モデルによって生成されるシーケンスの分布とデータセットからのシーケンスとの差異を最小化できる。
得られた手法であるSequenceMatchは、敵の訓練やアーキテクチャの変更なしに実装できる。
論文 参考訳(メタデータ) (2023-06-08T17:59:58Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。