論文の概要: Gaussian Process Molecule Property Prediction with FlowMO
- arxiv url: http://arxiv.org/abs/2010.01118v2
- Date: Wed, 14 Oct 2020 08:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 00:48:15.133918
- Title: Gaussian Process Molecule Property Prediction with FlowMO
- Title(参考訳): FlowMOを用いたガウスプロセス分子特性予測
- Authors: Henry B. Moss, Ryan-Rhys Griffiths
- Abstract要約: FlowMOは、Gaussian Processesを使った分子特性予測のためのオープンソースのライブラリである。
ユーザは、よく校正された不確実性推定、アクティブラーニングおよび分子設計アプリケーションの中心となる出力で予測を行うことができる。
- 参考スコア(独自算出の注目度): 7.72630981555675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present FlowMO: an open-source Python library for molecular property
prediction with Gaussian Processes. Built upon GPflow and RDKit, FlowMO enables
the user to make predictions with well-calibrated uncertainty estimates, an
output central to active learning and molecular design applications. Gaussian
Processes are particularly attractive for modelling small molecular datasets, a
characteristic of many real-world virtual screening campaigns where
high-quality experimental data is scarce. Computational experiments across
three small datasets demonstrate comparable predictive performance to deep
learning methods but with superior uncertainty calibration.
- Abstract(参考訳): ガウス過程を伴う分子特性予測のためのオープンソースのpythonライブラリであるflowmoを提案する。
gpflowとrdkit上に構築されたflowmoは、アクティブラーニングと分子設計アプリケーションの中心となるアウトプットである、不確実性推定を適切に調整した予測を可能にする。
ガウス過程は、高品質の実験データが不足している多くの現実世界の仮想スクリーニングキャンペーンの特徴である、小さな分子データセットのモデリングにおいて特に魅力的である。
3つの小さなデータセットにわたる計算実験は、ディープラーニング手法に匹敵する予測性能を示すが、不確実性のキャリブレーションが優れている。
関連論文リスト
- Computation-Aware Gaussian Processes: Model Selection And Linear-Time Inference [55.150117654242706]
我々は、1.8万のデータポイントでトレーニングされた計算対応GPのモデル選択が、1つのGPU上で数時間以内に可能であることを示す。
この研究の結果、ガウス過程は、不確実性を定量化する能力を著しく妥協することなく、大規模なデータセットで訓練することができる。
論文 参考訳(メタデータ) (2024-11-01T21:11:48Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Mixtures of Gaussian process experts based on kernel stick-breaking
processes [0.6396288020763143]
本稿では,カーネルスティックブレーキングプロセスに基づくガウスプロセスエキスパートの混合モデルを提案する。
我々のモデルは直感的な魅力を維持しつつ、既存のモデルの性能を改善している。
モデル挙動と予測性能の改善は、6つのデータセットを用いた実験で実証された。
論文 参考訳(メタデータ) (2023-04-26T21:23:01Z) - Conditional Neural Processes for Molecules [0.0]
ニューラルプロセス(NPs)はガウス過程(GPs)に類似した特性を持つ伝達学習のモデルである
本稿では,MLモデルのベンチマークのためのドッキングスコアのデータセットであるDOCKSTRINGに対して,条件付きニューラルプロセス(CNP)を適用する。
CNPは、QSARモデリングに共通する教師付き学習ベースラインに対して、数ショットの学習タスクにおいて、競合する性能を示す。
論文 参考訳(メタデータ) (2022-10-17T16:10:12Z) - Building Robust Machine Learning Models for Small Chemical Science Data:
The Case of Shear Viscosity [3.4761212729163313]
我々はLennard-Jones (LJ)流体のせん断粘度を予測するために、いくつかの機械学習モデルを訓練する。
具体的には,モデル選択,性能評価,不確実性定量化に関する課題について検討した。
論文 参考訳(メタデータ) (2022-08-23T07:33:14Z) - Multi-fidelity Hierarchical Neural Processes [79.0284780825048]
多要素代理モデリングは、異なるシミュレーション出力を融合させることで計算コストを削減する。
本稿では,多階層型階層型ニューラルネットワーク(MF-HNP)を提案する。
疫学および気候モデリングタスクにおけるMF-HNPの評価を行い、精度と不確実性評価の観点から競合性能を達成した。
論文 参考訳(メタデータ) (2022-06-10T04:54:13Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Knowledge transfer across cell lines using Hybrid Gaussian Process
models with entity embedding vectors [62.997667081978825]
生物化学的プロセスを開発するために、多数の実験が実施されている。
既に開発されたプロセスのデータを利用して、新しいプロセスの予測を行い、必要な実験の数を大幅に削減できるだろうか。
論文 参考訳(メタデータ) (2020-11-27T17:38:15Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。