論文の概要: Shape is (almost) all!: Persistent homology features (PHFs) are an
information rich input for efficient molecular machine learning
- arxiv url: http://arxiv.org/abs/2304.07554v1
- Date: Sat, 15 Apr 2023 13:24:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 18:24:32.179294
- Title: Shape is (almost) all!: Persistent homology features (PHFs) are an
information rich input for efficient molecular machine learning
- Title(参考訳): 形は(ほとんど)すべてです!
持続的ホモロジー特徴(PHF)は効率的な分子機械学習のための情報豊富な入力である
- Authors: Ella Gale
- Abstract要約: 化学データセットは、機械学習で一般的に使用されるデータセットと比べて非常に小さい傾向にある。
永続ホモロジーは、異なるスケールで点雲の位相的形状特性を測定する。
我々は、分子の形状を符号化する永続的ホモロジー特徴(PHF)を作成し、シンボル的詳細の多くを失う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3-D shape is important to chemistry, but how important? Machine learning
works best when the inputs are simple and match the problem well. Chemistry
datasets tend to be very small compared to those generally used in machine
learning so we need to get the most from each datapoint. Persistent homology
measures the topological shape properties of point clouds at different scales
and is used in topological data analysis. Here we investigate what persistent
homology captures about molecular structure and create persistent homology
features (PHFs) that encode a molecule's shape whilst losing most of the
symbolic detail like atom labels, valence, charge, bonds etc. We demonstrate
the usefulness of PHFs on a series of chemical datasets: QM7, lipophilicity,
Delaney and Tox21. PHFs work as well as the best benchmarks. PHFs are very
information dense and much smaller than other encoding methods yet found,
meaning ML algorithms are much more energy efficient. PHFs success despite
losing a large amount of chemical detail highlights how much of chemistry can
be simplified to topological shape.
- Abstract(参考訳): 3次元形状は化学にとって重要であるが、どの程度重要か?
機械学習は、入力が単純で問題によくマッチするときに最もうまく機能する。
化学データセットは、機械学習で一般的に使用されるデータセットに比べて非常に小さい傾向があるため、各データポイントから最大限を得る必要があります。
永続ホモロジーは点雲の位相的形状特性を異なるスケールで測定し、位相データ解析に使用される。
ここでは、分子構造について永続ホモロジーが何を捉え、原子ラベル、原子価、電荷、結合などの象徴的な詳細をなくしながら分子の形状を符号化する永続ホモロジー特徴(PHF)を作成する。
QM7, リポフィリティー, Delaney, Tox21といった一連の化学データセット上でのPHFの有用性を示す。
PHFは最高のベンチマークと同様に動作する。
PHFは情報密度が高く、他の符号化手法よりもはるかに小さいため、MLアルゴリズムの方がはるかにエネルギー効率が高い。
phfsの成功 化学の詳細な詳細が失われながらも、化学がどれだけトポロジカルな形に単純化できるかを強調する。
関連論文リスト
- MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Learning Universal and Robust 3D Molecular Representations with Graph
Convolutional Networks [19.647002925751774]
本稿では,3次元分子のグラフ表現に基づく汎用かつ堅牢な指向性ノードペア(DNP)記述法を提案する。
我々のDNP記述子は、以前のものと比べて頑丈であり、複数の分子タイプに適用できる。
本稿では,ロバスト分子グラフ畳み込みネットワーク(RoM-GCN)を構築し,ノードとエッジの両方の特徴を考慮に入れた。
論文 参考訳(メタデータ) (2023-07-24T02:50:19Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Multiresolution Graph Transformers and Wavelet Positional Encoding for
Learning Hierarchical Structures [6.875312133832078]
複数のスケールで大きな分子を表現できる最初のグラフトランスアーキテクチャであるMulti resolution Graph Transformer (MGT)を提案する。
MGTは原子の表現を学習し、それらを有意義な官能基または繰り返し単位に分類することができる。
提案モデルでは, 高分子とペプチドからなるマクロ分子データセットと, 薬物様分子データセットの2つの結果を得た。
論文 参考訳(メタデータ) (2023-02-17T01:32:44Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - ATOM3D: Tasks On Molecules in Three Dimensions [91.72138447636769]
近年、深層ニューラルネットワークが注目されている。
本稿では,生物分子のいくつかの重要なクラスにまたがる新しいデータセットと既存のデータセットのコレクションであるATOM3Dを紹介する。
これらのタスクごとに3次元の分子学習ネットワークを開発し、パフォーマンスを一貫して改善します。
論文 参考訳(メタデータ) (2020-12-07T20:18:23Z) - ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep
Learning [6.88204255655161]
薬物発見においては、化学物質のグラフ構造に関する知識が不可欠である。
画像を自動的に分析し、それらを化学グラフ構造に変換するツールは、多くのアプリケーションに役立つだろう。
我々は,光化合物認識のためのディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-02-23T14:30:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。