論文の概要: HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations
- arxiv url: http://arxiv.org/abs/2303.15604v1
- Date: Mon, 27 Mar 2023 21:21:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 17:19:00.470815
- Title: HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations
- Title(参考訳): HD-Bind:低精度・超次元双対表現を用いた分子構造の符号化
- Authors: Derek Jones, Jonathan E. Allen, Xiaohua Zhang, Behnam Khaleghi,
Jaeyoung Kang, Weihong Xu, Niema Moshiri, Tajana S. Rosing
- Abstract要約: 超次元計算(HDC)は、低精度二進ベクトル算術を活用できる学習パラダイムである。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高いことを示す。
- 参考スコア(独自算出の注目度): 3.3934198248179026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Publicly available collections of drug-like molecules have grown to comprise
10s of billions of possibilities in recent history due to advances in chemical
synthesis. Traditional methods for identifying ``hit'' molecules from a large
collection of potential drug-like candidates have relied on biophysical theory
to compute approximations to the Gibbs free energy of the binding interaction
between the drug to its protein target. A major drawback of the approaches is
that they require exceptional computing capabilities to consider for even
relatively small collections of molecules.
Hyperdimensional Computing (HDC) is a recently proposed learning paradigm
that is able to leverage low-precision binary vector arithmetic to build
efficient representations of the data that can be obtained without the need for
gradient-based optimization approaches that are required in many conventional
machine learning and deep learning approaches. This algorithmic simplicity
allows for acceleration in hardware that has been previously demonstrated for a
range of application areas. We consider existing HDC approaches for molecular
property classification and introduce two novel encoding algorithms that
leverage the extended connectivity fingerprint (ECFP) algorithm.
We show that HDC-based inference methods are as much as 90 times more
efficient than more complex representative machine learning methods and achieve
an acceleration of nearly 9 orders of magnitude as compared to inference with
molecular docking. We demonstrate multiple approaches for the encoding of
molecular data for HDC and examine their relative performance on a range of
challenging molecular property prediction and drug-protein binding
classification tasks. Our work thus motivates further investigation into
molecular representation learning to develop ultra-efficient pre-screening
tools.
- Abstract(参考訳): 一般に入手可能な薬物様分子のコレクションは、化学合成の進歩により、近年10億の可能性を秘めている。
潜在的薬物様候補の大規模なコレクションから‘hit’分子を同定する伝統的な方法は、薬物とタンパク質標的との結合相互作用のギブス自由エネルギーの近似を計算するために生物物理学理論に依存している。
アプローチの大きな欠点は、比較的小さな分子の集合を考えるために特別な計算能力が必要であることである。
超次元コンピューティング(HDC)は、最近提案された学習パラダイムであり、従来の機械学習やディープラーニングのアプローチで必要とされる勾配に基づく最適化アプローチを必要とせずに、低精度のバイナリベクトル演算を利用して、得られるデータの効率的な表現を構築することができる。
このアルゴリズムの単純さは、これまで様々な応用領域で実証されてきたハードウェアの加速を可能にする。
分子特性分類のための既存のHDC手法を検討し、拡張接続指紋(ECFP)アルゴリズムを利用する2つの新しい符号化アルゴリズムを導入する。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高く,分子ドッキングによる推論に比べて約9桁の高速化を実現していることを示す。
本稿では,hdcの分子データのエンコーディングに関する複数のアプローチを示し,その相対的性能を分子特性予測と薬物-タンパク質結合分類の課題で検証する。
この研究は、分子表現学習のさらなる研究を動機付け、超効率的な事前スクリーニングツールを開発した。
関連論文リスト
- Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - LIMO: Latent Inceptionism for Targeted Molecule Generation [14.391216237573369]
本研究は,分子発生を極めて促進する分子発生機構であるLIMO(Latent Inceptionism on Molecules)について述べる。
総合的な実験により、LIMOはベンチマークタスクで競争力を発揮することが示された。
生成した薬物様化合物の1つが、ヒトエストロゲン受容体に対して6~14ドルのK_D$を予測している。
論文 参考訳(メタデータ) (2022-06-17T21:05:58Z) - MoleHD: Ultra-Low-Cost Drug Discovery using Hyperdimensional Computing [2.7462881838152913]
分子特性予測のための脳誘発超次元計算(HDC)に基づくMoleHDを提案する。
MoleHDは、ランダムスプリットとスキャフォールドスプリットで、平均3つのデータセットでROC-AUCスコアを達成している。
私たちの知る限りでは、この方法が初めてHDCベースの薬物発見法である。
論文 参考訳(メタデータ) (2021-06-05T13:33:21Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - TorsionNet: A Reinforcement Learning Approach to Sequential Conformer
Search [17.2131835813425]
剛性ロータ近似の下での強化学習に基づく効率的なシーケンシャルコンバータ探索手法を提案する。
以上の結果から,TorsionNetは大きなアルカンに対して4倍,未探索の生体高分子リグニンでは数桁,高い評価率のケモインフォマティクス法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-12T11:03:29Z) - DeepGS: Deep Representation Learning of Graphs and Sequences for
Drug-Target Binding Affinity Prediction [8.292330541203647]
本稿では、ディープニューラルネットワークを用いて、アミノ酸やSMILES配列から局所的な化学コンテキストを抽出する、DeepGSと呼ばれる新しいエンドツーエンド学習フレームワークを提案する。
我々は提案手法を,KronRLS,Sim,DeepDTA,DeepCPIといった最先端モデルと比較するための広範な実験を行った。
論文 参考訳(メタデータ) (2020-03-31T01:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。