論文の概要: MolGrapher: Graph-based Visual Recognition of Chemical Structures
- arxiv url: http://arxiv.org/abs/2308.12234v1
- Date: Wed, 23 Aug 2023 16:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 13:24:27.315375
- Title: MolGrapher: Graph-based Visual Recognition of Chemical Structures
- Title(参考訳): MolGrapher: グラフに基づく化学構造の視覚的認識
- Authors: Lucas Morin, Martin Danelljan, Maria Isabel Agea, Ahmed Nassar, Valery
Weber, Ingmar Meijer, Peter Staar, Fisher Yu
- Abstract要約: 化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
- 参考スコア(独自算出の注目度): 50.13749978547401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The automatic analysis of chemical literature has immense potential to
accelerate the discovery of new materials and drugs. Much of the critical
information in patent documents and scientific articles is contained in
figures, depicting the molecule structures. However, automatically parsing the
exact chemical structure is a formidable challenge, due to the amount of
detailed information, the diversity of drawing styles, and the need for
training data. In this work, we introduce MolGrapher to recognize chemical
structures visually. First, a deep keypoint detector detects the atoms. Second,
we treat all candidate atoms and bonds as nodes and put them in a graph. This
construct allows a natural graph representation of the molecule. Last, we
classify atom and bond nodes in the graph with a Graph Neural Network. To
address the lack of real training data, we propose a synthetic data generation
pipeline producing diverse and realistic results. In addition, we introduce a
large-scale benchmark of annotated real molecule images, USPTO-30K, to spur
research on this critical topic. Extensive experiments on five datasets show
that our approach significantly outperforms classical and learning-based
methods in most settings. Code, models, and datasets are available.
- Abstract(参考訳): 化学文献の自動分析は、新しい物質や薬物の発見を加速する大きな可能性を秘めている。
特許文書や科学論文における重要な情報の多くは、分子構造を描写した図に含まれている。
しかし, 正確な化学構造を自動的に解析することは, 詳細な情報量, 描画スタイルの多様性, トレーニングデータの必要性など, 非常に難しい課題である。
本稿では,化学構造を視覚的に認識するMolGrapherを紹介する。
まず、深いキーポイント検出器が原子を検出する。
第二に、すべての候補原子と結合をノードとして扱い、それらをグラフに配置する。
この構造は分子の自然なグラフ表現を可能にする。
最後に、グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
実際のトレーニングデータの欠如に対処するために,多様な現実的な結果を生成する合成データ生成パイプラインを提案する。
さらに、この重要なトピックの研究を促進するために、注釈付き実分子画像の大規模ベンチマークUSPTO-30Kを導入する。
5つのデータセットを広範囲に実験した結果,我々のアプローチは,ほとんどの設定において,古典的および学習的手法を大きく上回っていることがわかった。
コード、モデル、データセットが利用可能だ。
関連論文リスト
- Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Molecular Contrastive Learning with Chemical Element Knowledge Graph [16.136921143416927]
分子表現学習は、分子特性予測や薬物設計など、下流の複数のタスクに寄与する。
我々は,元素間の微視的関連を要約するケミカル要素知識グラフ(KG)を構築した。
最初のモジュールである知識誘導グラフ拡張は、ケミカル要素KGに基づいて元の分子グラフを増強する。
第2のモジュールである知識対応グラフ表現は、元の分子グラフの共通グラフエンコーダと知識対応メッセージパッシングニューラルネットワーク(KMPNN)を用いて分子表現を抽出し、拡張された分子グラフの複雑な情報をエンコードする。
論文 参考訳(メタデータ) (2021-12-01T15:04:39Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - Learning Attributed Graph Representations with Communicative Message
Passing Transformer [3.812358821429274]
分子グラフ表現を改善するために,コミュニケーティブメッセージパッシングトランス (CoMPT) ニューラルネットワークを提案する。
分子を完全連結グラフとして扱う従来のトランスフォーマースタイルのGNNとは異なり、グラフ接続帰納バイアスを利用するメッセージ拡散機構を導入する。
論文 参考訳(メタデータ) (2021-07-19T11:58:32Z) - MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks [11.994553575596228]
MolCLRは、大規模なラベルなしの分子データセットのための自己監視学習フレームワークです。
原子マスキング、結合除去、サブグラフ除去の3つの新しい分子グラフ増強法を提案する。
提案手法は,多くの挑戦的データセットに対して最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T17:35:18Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep
Learning [6.88204255655161]
薬物発見においては、化学物質のグラフ構造に関する知識が不可欠である。
画像を自動的に分析し、それらを化学グラフ構造に変換するツールは、多くのアプリケーションに役立つだろう。
我々は,光化合物認識のためのディープニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-02-23T14:30:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。