論文の概要: Combating small molecule aggregation with machine learning
- arxiv url: http://arxiv.org/abs/2105.00267v1
- Date: Sat, 1 May 2021 14:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 13:44:50.071157
- Title: Combating small molecule aggregation with machine learning
- Title(参考訳): 機械学習による小分子凝集と闘う
- Authors: Kuan Lee, Ann Yang, Yen-Chu Lin, Daniel Reker, Goncalo J. L. Bernardes
and Tiago Rodrigues
- Abstract要約: 我々は,小コロイド凝集分子(SCAMs)に自信と知性を持ってフラグを付けるベスポーク機械学習ツールを提案する。
我々のデータは、詐欺を予測するための機械学習の先例のない有用性を示し、困難なサンプル外検証において正しい予測の80%を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Biological screens are plagued by false positive hits resulting from
aggregation. Thus, methods to triage small colloidally aggregating molecules
(SCAMs) are in high demand. Herein, we disclose a bespoke machine-learning tool
to confidently and intelligibly flag such entities. Our data demonstrate an
unprecedented utility of machine learning for predicting SCAMs, achieving 80%
of correct predictions in a challenging out-of-sample validation. The tool
outperformed a panel of expert chemists, who correctly predicted 61 +/- 7% of
the same test molecules in a Turing-like test. Further, the computational
routine provided insight into molecular features governing aggregation that had
remained hidden to expert intuition. Leveraging our tool, we quantify that up
to 15-20% of ligands in publicly available chemogenomic databases have the high
potential to aggregate at typical screening concentrations, imposing caution in
systems biology and drug design programs. Our approach provides a means to
augment human intuition, mitigate attrition and a pathway to accelerate future
molecular medicine.
- Abstract(参考訳): 生物学的スクリーンは凝集による偽陽性に苦しめられている。
したがって、小さなコロイド凝集分子(SCAM)をトリアージする方法が要求される。
本稿では,そのようなエンティティに自信と知性を持ってフラグを付ける機械学習ツールを公開する。
我々のデータは、SCAMの予測に機械学習が前例のない有用性を示し、挑戦的なサンプル外検証において正しい予測の80%を達成している。
このツールは、チューリングのようなテストで同じテスト分子の61+/-7%を正しく予測した専門家化学者のパネルを上回った。
さらに計算ルーチンは、専門家の直感に隠れていた凝集を司る分子的特徴に関する洞察を提供した。
このツールを活用することで、利用可能な化学遺伝学データベースにおけるリガンドの最大15~20%が、典型的なスクリーニング濃度で集約する可能性が高いことを定量化し、システム生物学および薬物設計プログラムにおいて注意を喚起する。
我々のアプローチは、人間の直感を増強し、誘因を緩和し、将来の分子医学を加速する手段を提供する。
関連論文リスト
- MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - TwinBooster: Synergising Large Language Models with Barlow Twins and
Gradient Boosting for Enhanced Molecular Property Prediction [0.0]
本研究では, 微調整された大規模言語モデルを用いて, テキスト情報に基づく生物学的アッセイを統合する。
このアーキテクチャは、測定情報と分子指紋の両方を使用して、真の分子情報を抽出する。
TwinBoosterは最先端のゼロショット学習タスクを提供することで、目に見えないバイオアッセイや分子の性質の予測を可能にする。
論文 参考訳(メタデータ) (2024-01-09T10:36:20Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - InstructBio: A Large-scale Semi-supervised Learning Paradigm for
Biochemical Problems [38.57333125315448]
InstructMolは、ラベルなし例をうまく活用するための半教師付き学習アルゴリズムである。
InstructBioは分子モデルの一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-04-08T04:19:22Z) - HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations [3.3934198248179026]
超次元計算(HDC)は、低精度二進ベクトル算術を活用できる学習パラダイムである。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高いことを示す。
論文 参考訳(メタデータ) (2023-03-27T21:21:46Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。