論文の概要: MoleHD: Ultra-Low-Cost Drug Discovery using Hyperdimensional Computing
- arxiv url: http://arxiv.org/abs/2106.02894v3
- Date: Sat, 5 Feb 2022 19:58:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-27 19:08:00.599370
- Title: MoleHD: Ultra-Low-Cost Drug Discovery using Hyperdimensional Computing
- Title(参考訳): MoleHD:超低速薬物発見のための超次元計算
- Authors: Dongning Ma, Rahul Thapa, Xun Jiao
- Abstract要約: 分子特性予測のための脳誘発超次元計算(HDC)に基づくMoleHDを提案する。
MoleHDは、ランダムスプリットとスキャフォールドスプリットで、平均3つのデータセットでROC-AUCスコアを達成している。
私たちの知る限りでは、この方法が初めてHDCベースの薬物発見法である。
- 参考スコア(独自算出の注目度): 2.7462881838152913
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Modern drug discovery is often time-consuming, complex and cost-ineffective
due to the large volume of molecular data and complicated molecular properties.
Recently, machine learning algorithms have shown promising results in virtual
screening of automated drug discovery by predicting molecular properties. While
emerging learning methods such as graph neural networks and recurrent neural
networks exhibit high accuracy, they are also notoriously computation-intensive
and memory-intensive with operations such as feature embeddings or deep
convolutions. In this paper, we propose a viable alternative to existing
learning methods by presenting MoleHD, a method based on brain-inspired
hyperdimensional computing (HDC) for molecular property prediction. We develop
HDC encoders to project SMILES representation of a molecule into
high-dimensional vectors that are used for HDC training and inference. We
perform an extensive evaluation using 29 classification tasks from 3
widely-used molecule datasets (Clintox, BBBP, SIDER) under three splits methods
(random, scaffold, and stratified). By an comprehensive comparison with 8
existing learning models including SOTA graph/recurrent neural networks, we
show that MoleHD is able to achieve highest ROC-AUC score on random and
scaffold splits on average across 3 datasets and achieve second-highest on
stratified split. Importantly, MoleHD achieves such performance with
significantly reduced computing cost and training efforts. To the best of our
knowledge, this is the first HDC-based method for drug discovery. The promising
results presented in this paper can potentially lead to a novel path in drug
discovery research.
- Abstract(参考訳): 現代の薬物発見は、大量の分子データと複雑な分子特性のために、しばしば時間がかかり、複雑で費用がかからない。
近年、機械学習アルゴリズムは、分子特性の予測による自動薬物発見の仮想スクリーニングにおいて有望な結果を示している。
グラフニューラルネットワークやリカレントニューラルネットワークといった新しい学習手法は精度が高いが、計算集約的でメモリ集約的な機能埋め込みや深層畳み込みといった操作でも知られている。
本稿では,分子特性予測のための脳にインスパイアされた超次元計算(HDC)に基づく手法であるMoleHDを提案することによって,既存の学習手法に代わる実現可能な代替手法を提案する。
我々は,分子のSMILES表現をHDCトレーニングや推論に用いる高次元ベクトルに投影するHDCエンコーダを開発した。
広範に使用されている3つの分子データセット(クリトックス,BBBP,SIDER)の29の分類タスクを3つの分割手法(ランダム,足場,層状化)で広範囲に評価した。
SOTAグラフ/リカレントニューラルネットワークを含む8つの既存の学習モデルと総合的に比較することにより、MoleHDは3つのデータセットにまたがる平均的なランダムスプリットと足場スプリットでROC-AUCスコアを達成でき、階層化スプリットでは2番目に高いスコアが得られることを示す。
重要なことに、molehdは計算コストとトレーニング労力を大幅に削減することで、このようなパフォーマンスを実現しています。
私たちの知る限りでは、この方法が初めてHDCベースの薬物発見法である。
この論文で示される有望な結果は、薬物発見研究の新たな道へと繋がる可能性がある。
関連論文リスト
- Molecule Joint Auto-Encoding: Trajectory Pretraining with 2D and 3D
Diffusion [19.151643496588022]
分子ジョイントオートエンコーディング(分子JAE)の事前学習法を提案する。
MoleculeJAEは2D結合(トポロジー)と3D配座(幾何学)の両方の情報を学習することができる。
MoleculeJAEは、20タスク中15タスクで最先端のパフォーマンスに到達することで、その効果を実証している。
論文 参考訳(メタデータ) (2023-12-06T12:58:37Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations [3.3934198248179026]
超次元計算(HDC)は、低精度二進ベクトル算術を活用できる学習パラダイムである。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高いことを示す。
論文 参考訳(メタデータ) (2023-03-27T21:21:46Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Scalable training of graph convolutional neural networks for fast and
accurate predictions of HOMO-LUMO gap in molecules [1.8947048356389908]
この研究は、数百万の分子の物質特性を予測するために、HPCシステム上でGCNNモデルを構築することに焦点を当てている。
PyTorchで分散データ並列性を活用するために,大規模GCNNトレーニング用の社内ライブラリであるHydraGNNを使用しています。
我々は2つのオープンソースの大規模グラフデータセットの並列トレーニングを行い、HOMO-LUMOギャップとして知られる重要な量子特性のためのGCNN予測器を構築する。
論文 参考訳(メタデータ) (2022-07-22T20:54:22Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - ATOM3D: Tasks On Molecules in Three Dimensions [91.72138447636769]
近年、深層ニューラルネットワークが注目されている。
本稿では,生物分子のいくつかの重要なクラスにまたがる新しいデータセットと既存のデータセットのコレクションであるATOM3Dを紹介する。
これらのタスクごとに3次元の分子学習ネットワークを開発し、パフォーマンスを一貫して改善します。
論文 参考訳(メタデータ) (2020-12-07T20:18:23Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - Targeting SARS-CoV-2 with AI- and HPC-enabled Lead Generation: A First
Data Release [8.090016327163564]
このデータリリースは、4.2B分子と60TBの事前計算データの構造情報を含んでいる。
有望なアプローチのひとつは、機械学習(ML)と人工知能(AI)ツールをトレーニングして、多数の小さな分子をスクリーニングすることだ。
今後のリリースでは、より詳細な分子シミュレーションや計算モデル、その他の製品を含むように、データを拡大する予定である。
論文 参考訳(メタデータ) (2020-05-28T01:33:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。