論文の概要: Generalization within in silico screening
- arxiv url: http://arxiv.org/abs/2307.09379v2
- Date: Tue, 23 Jul 2024 16:37:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-24 23:33:02.469489
- Title: Generalization within in silico screening
- Title(参考訳): シリカスクリーニングにおける一般化
- Authors: Andreas Loukas, Pan Kessel, Vladimir Gligorijevic, Richard Bonneau,
- Abstract要約: シリカスクリーニングでは、予測モデルを使用して、実験的な検証のためにライブラリから好ましい特性を持つ化合物のバッチを選択する。
学習理論を拡張することにより、選択政策の選択性は一般化に大きな影響を及ぼすことを示す。
モデルがバッチで望ましい結果のごく一部を予測できる能力を考えると,一般化が著しく向上できることが示される。
- 参考スコア(独自算出の注目度): 19.58677466616286
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In silico screening uses predictive models to select a batch of compounds with favorable properties from a library for experimental validation. Unlike conventional learning paradigms, success in this context is measured by the performance of the predictive model on the selected subset of compounds rather than the entire set of predictions. By extending learning theory, we show that the selectivity of the selection policy can significantly impact generalization, with a higher risk of errors occurring when exclusively selecting predicted positives and when targeting rare properties. Our analysis suggests a way to mitigate these challenges. We show that generalization can be markedly enhanced when considering a model's ability to predict the fraction of desired outcomes in a batch. This is promising, as the primary aim of screening is not necessarily to pinpoint the label of each compound individually, but rather to assemble a batch enriched for desirable compounds. Our theoretical insights are empirically validated across diverse tasks, architectures, and screening scenarios, underscoring their applicability.
- Abstract(参考訳): シリカスクリーニングでは、予測モデルを使用して、実験的な検証のためにライブラリから好ましい特性を持つ化合物のバッチを選択する。
従来の学習パラダイムとは異なり、この文脈における成功は、予測の集合全体ではなく、選択された化合物のサブセット上での予測モデルの性能によって測定される。
学習理論を拡張することにより、選択ポリシーの選択性は、予測された正を選択的に選択したり、稀な特性を標的にした場合に発生するエラーのリスクが高く、一般化に大きな影響を及ぼすことを示した。
我々の分析はこれらの課題を緩和する方法を示唆している。
モデルがバッチで望ましい結果のごく一部を予測できる能力を考えると,一般化が著しく向上できることが示される。
スクリーニングの主な目的は、各化合物のラベルを個別に特定することではなく、望ましい化合物に富んだバッチを組み立てることである。
私たちの理論的洞察は、様々なタスク、アーキテクチャ、スクリーニングシナリオにまたがって実証的に検証され、それらの適用性を強調します。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - Selection by Prediction with Conformal p-values [7.917044695538599]
本研究では,未観測結果がユーザ指定値を超える候補を選択するためのスクリーニング手順について検討する。
本研究では,任意の予測モデルをラップして候補のサブセットを生成する手法を開発した。
論文 参考訳(メタデータ) (2022-10-04T06:34:49Z) - Low cost prediction of probability distributions of molecular properties
for early virtual screening [0.8702432681310399]
本稿では, 階層的相関再構築手法を適用し, 人口統計, 財務, 天文学的データの解析に応用した。
この手法は、望まれる物理化学的/ADMET特性の可能性が低い化合物の迅速な拒絶を可能にするため、医薬化学者にとって大きな支援となる。
論文 参考訳(メタデータ) (2022-07-21T13:29:26Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z) - Selective Ensembles for Consistent Predictions [19.154189897847804]
不整合は高い文脈では望ましくない。
この矛盾は、予測を超えて属性を特徴付けていることが示される。
我々は,選択的アンサンブルが低禁制率を維持しつつ,一貫した予測と特徴属性を達成することを証明した。
論文 参考訳(メタデータ) (2021-11-16T05:03:56Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。