論文の概要: RetroOOD: Understanding Out-of-Distribution Generalization in
Retrosynthesis Prediction
- arxiv url: http://arxiv.org/abs/2312.10900v1
- Date: Mon, 18 Dec 2023 03:12:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 21:24:38.804432
- Title: RetroOOD: Understanding Out-of-Distribution Generalization in
Retrosynthesis Prediction
- Title(参考訳): RetroOOD:再合成予測における分布外一般化の理解
- Authors: Yemin Yu, Luotian Yuan, Ying Wei, Hanyu Gao, Xinhai Ye, Zhihua Wang,
Fei Wu
- Abstract要約: 機械学習によるレトロシンセシス予測モデルが広く採用されている。
標準ベンチマークの着実な進歩にもかかわらず、分布シフトの前提下での既存の再合成予測モデルの理解は停滞している。
任意のオフザシェルフ再合成予測アルゴリズムのOOD一般化を改善する2つのモデルに依存しない手法を提案する。
- 参考スコア(独自算出の注目度): 15.699673606816496
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning-assisted retrosynthesis prediction models have been gaining
widespread adoption, though their performances oftentimes degrade significantly
when deployed in real-world applications embracing out-of-distribution (OOD)
molecules or reactions. Despite steady progress on standard benchmarks, our
understanding of existing retrosynthesis prediction models under the premise of
distribution shifts remains stagnant. To this end, we first formally sort out
two types of distribution shifts in retrosynthesis prediction and construct two
groups of benchmark datasets. Next, through comprehensive experiments, we
systematically compare state-of-the-art retrosynthesis prediction models on the
two groups of benchmarks, revealing the limitations of previous in-distribution
evaluation and re-examining the advantages of each model. More remarkably, we
are motivated by the above empirical insights to propose two model-agnostic
techniques that can improve the OOD generalization of arbitrary off-the-shelf
retrosynthesis prediction algorithms. Our preliminary experiments show their
high potential with an average performance improvement of 4.6%, and the
established benchmarks serve as a foothold for further retrosynthesis
prediction research towards OOD generalization.
- Abstract(参考訳): 機械学習が支援するレトロシンセシス予測モデルが広く採用されているが、その性能は、od(out-of-distribution)分子や反応を取り入れた現実世界のアプリケーションでデプロイされた場合、著しく低下することが多い。
標準ベンチマークの着実な進歩にもかかわらず、分布シフトの前提下での既存の再合成予測モデルの理解は停滞している。
そこで我々はまず,回帰合成予測における2種類の分布シフトを正式に分類し,ベンチマークデータセットの2つのグループを構築する。
次に,包括的実験により,2つのベンチマーク群における最先端の逆合成予測モデルを体系的に比較し,過去の分布評価の限界を明らかにし,各モデルの利点を再検討する。
以上の経験的知見から,任意のオフザシェルフ逆合成予測アルゴリズムのOOD一般化を改善する2つのモデルに依存しない手法を提案する。
予備実験では, 平均性能が4.6%向上する可能性を示し, 確立されたベンチマークは, OOD一般化に向けた再合成予測研究の足場となる。
関連論文リスト
- Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Forecast reconciliation for vaccine supply chain optimization [61.13962963550403]
ワクチンサプライチェーン最適化は階層的な時系列予測の恩恵を受けることができる。
異なる階層レベルの予測は、上位レベルの予測が下位レベルの予測の総和と一致しないときに不整合となる。
我々は2010年から2021年にかけてのGSKの販売データを階層的時系列としてモデル化し,ワクチン販売予測問題に取り組む。
論文 参考訳(メタデータ) (2023-05-02T14:34:34Z) - Better Modelling Out-of-Distribution Regression on Distributed Acoustic
Sensor Data Using Anchored Hidden State Mixup [0.7455546102930911]
トレーニングデータとテストデータの統計的分布が異なる状況への機械学習モデルの応用を一般化することは、複雑な問題であった。
本稿では,正規化の新たなペナルティを形成するために,多様体隠蔽状態の混合と観測類似性を利用したアンカー型回帰混合アルゴリズムを提案する。
提案手法の既存手法に対する一般化性能を広範囲に評価し,提案手法が最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2022-02-23T03:12:21Z) - Feature-weighted Stacking for Nonseasonal Time Series Forecasts: A Case
Study of the COVID-19 Epidemic Curves [0.0]
本研究では,非シーズン時間帯での利用可能性について,予測におけるアンサンブル手法について検討する。
予備予測段階における予測能力を証明する2つの予測モデルと2つのメタ機能からなる重畳アンサンブルを用いて遅延データ融合を提案する。
論文 参考訳(メタデータ) (2021-08-19T14:44:46Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Loss function based second-order Jensen inequality and its application
to particle variational inference [112.58907653042317]
粒子変分推論(PVI)は、後部分布の実験的近似としてモデルのアンサンブルを用いる。
PVIは、最適化されたモデルの多様性を保証するために、各モデルを反発力で反復的に更新する。
我々は,新たな一般化誤差を導出し,モデルの多様性を高めて低減できることを示す。
論文 参考訳(メタデータ) (2021-06-09T12:13:51Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Data Transfer Approaches to Improve Seq-to-Seq Retrosynthesis [1.6449390849183363]
再合成は、化学反応によって与えられた生成物化合物を合成するために反応化合物を推測する問題である。
レトロ合成に関する最近の研究は、より洗練された予測モデルの提案に焦点を当てている。
モデルをフィードするデータセットは、最高の一般化モデルを達成する上でも重要な役割を果たす。
論文 参考訳(メタデータ) (2020-10-02T05:27:51Z) - Our Evaluation Metric Needs an Update to Encourage Generalization [24.6240575061124]
一般的なベンチマークで人的パフォーマンスを上回るモデルでは、Out of Distributionデータへの露出によるパフォーマンスの大幅な低下が示される。
本稿では,評価中の一般化を促す簡易で斬新な評価指標WOOD Scoreを提案する。
論文 参考訳(メタデータ) (2020-07-14T08:15:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。