論文の概要: Augmenting Molecular Images with Vector Representations as a
Featurization Technique for Drug Classification
- arxiv url: http://arxiv.org/abs/2008.03646v1
- Date: Sun, 9 Aug 2020 04:26:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 04:33:17.609955
- Title: Augmenting Molecular Images with Vector Representations as a
Featurization Technique for Drug Classification
- Title(参考訳): ベクター表現による分子画像の増強と薬物分類への応用
- Authors: Daniel de Marchi, Amarjit Budhiraja
- Abstract要約: 本稿では,分子画像だけでは含まれない,あるいは容易に理解できない情報を符号化するバイナリベクトルを付加した分子画像の作成を提案する。
HIVウイルスを阻害すると41,127個の分子がラベル付けされたパンデ研究所で公表されたHIVデータセット上で,本手法を試験した。
- 参考スコア(独自算出の注目度): 4.873362301533825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the key steps in building deep learning systems for drug
classification and generation is the choice of featurization for the molecules.
Previous featurization methods have included molecular images, binary strings,
graphs, and SMILES strings. This paper proposes the creation of molecular
images captioned with binary vectors that encode information not contained in
or easily understood from a molecular image alone. Specifically, we use Morgan
fingerprints, which encode higher level structural information, and MACCS keys,
which encode yes or no questions about a molecules properties and structure. We
tested our method on the HIV dataset published by the Pande lab, which consists
of 41,127 molecules labeled by if they inhibit the HIV virus. Our final model
achieved a state of the art AUC ROC on the HIV dataset, outperforming all other
methods. Moreover, the model converged significantly faster than most other
methods, requiring dramatically less computational power than unaugmented
images.
- Abstract(参考訳): 薬物の分類と生成のためのディープラーニングシステムを構築するための重要なステップの1つは、分子の創成の選択である。
以前は、分子画像、二分文字列、グラフ、スマイル文字列などがあった。
本稿では,分子画像のみに含まれる,あるいは理解が容易でない情報をエンコードする2進ベクトルをキャプションとした分子画像の作成を提案する。
具体的には、より高いレベルの構造情報をエンコードするmorgan fingerprintsと、分子の性質や構造についてイエスかノーかをエンコードするmaccs keysを使用します。
本手法をパンデ研究所が公開しているHIVデータセットで検証し,HIVウイルスを阻害すると41,127個の分子がラベル付けされた。
我々の最終モデルは、HIVデータセット上のAUC ROCの状態を達成し、他のすべての方法よりも優れています。
さらに、モデルは他のほとんどの方法よりもはるかに高速に収束し、未拡張画像よりも計算能力が劇的に低下した。
関連論文リスト
- MaskMol: Knowledge-guided Molecular Image Pre-Training Framework for Activity Cliffs [18.901322124389218]
MaskMolは知識誘導型分子画像自己教師型学習フレームワークである。
MaskMolは、複数のレベルの分子知識を考慮し、分子画像の表現を正確に学習する。
その結果,MaskMolの活性崖推定および複合有効性予測における高精度かつ伝達性を示した。
論文 参考訳(メタデータ) (2024-09-02T03:03:22Z) - Learning Molecular Representation in a Cell [18.170650265987792]
本稿では,細胞内情報ボトルネック法を用いて分子表現を学習するための情報アライメント(InfoAlign)手法を提案する。
我々は、分子と細胞応答データをノードとしてコンテキストグラフに統合し、化学、生物学的、計算基準に基づいて重み付けされたエッジと接続する。
提案手法は,既存のエンコーダをベースとしたコントラスト法よりも,アライメントの効率向上を目標としている。
論文 参考訳(メタデータ) (2024-06-17T19:48:42Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - IMG2SMI: Translating Molecular Structure Images to Simplified
Molecular-input Line-entry System [29.946393284884778]
我々は、画像特徴抽出にDeep Residual Networksを利用するモデルIGG2SMIと、分子記述生成にエンコーダ・デコーダ・トランスフォーマ層を導入する。
IMG2SMIは、分子MACCS Fingerprint Tanimoto similarityによって測定された分子類似性予測において、OSRA系システムよりも163%優れていた。
また、分子記述生成のための8100万分子を含む新しい分子予測データセットもリリースした。
論文 参考訳(メタデータ) (2021-09-03T19:57:07Z) - MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks [11.994553575596228]
MolCLRは、大規模なラベルなしの分子データセットのための自己監視学習フレームワークです。
原子マスキング、結合除去、サブグラフ除去の3つの新しい分子グラフ増強法を提案する。
提案手法は,多くの挑戦的データセットに対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T17:35:18Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。