論文の概要: ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep
Learning
- arxiv url: http://arxiv.org/abs/2002.09914v1
- Date: Sun, 23 Feb 2020 14:30:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:20:15.771209
- Title: ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep
Learning
- Title(参考訳): ChemGrapher:ディープラーニングによる化合物の光グラフ認識
- Authors: Martijn Oldenhof, Adam Arany, Yves Moreau and Jaak Simm
- Abstract要約: 薬物発見においては、化学物質のグラフ構造に関する知識が不可欠である。
画像を自動的に分析し、それらを化学グラフ構造に変換するツールは、多くのアプリケーションに役立つだろう。
我々は,光化合物認識のためのディープニューラルネットワークモデルを開発した。
- 参考スコア(独自算出の注目度): 6.88204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In drug discovery, knowledge of the graph structure of chemical compounds is
essential. Many thousands of scientific articles in chemistry and
pharmaceutical sciences have investigated chemical compounds, but in cases the
details of the structure of these chemical compounds is published only as an
images. A tool to analyze these images automatically and convert them into a
chemical graph structure would be useful for many applications, such drug
discovery. A few such tools are available and they are mostly derived from
optical character recognition. However, our evaluation of the performance of
those tools reveals that they make often mistakes in detecting the correct bond
multiplicity and stereochemical information. In addition, errors sometimes even
lead to missing atoms in the resulting graph. In our work, we address these
issues by developing a compound recognition method based on machine learning.
More specifically, we develop a deep neural network model for optical compound
recognition. The deep learning solution presented here consists of a
segmentation model, followed by three classification models that predict atom
locations, bonds and charges. Furthermore, this model not only predicts the
graph structure of the molecule but also produces all information necessary to
relate each component of the resulting graph to the source image. This solution
is scalable and could rapidly process thousands of images. Finally, we compare
empirically the proposed method to a well-established tool and observe
significant error reductions.
- Abstract(参考訳): 創薬においては、化学化合物のグラフ構造に関する知識が不可欠である。
化学や薬学における何千もの科学論文が化学物質を調査しているが、これらの化合物の構造の詳細は画像としてのみ公表されている。
これらの画像を自動的に分析して化学グラフ構造に変換するツールは、薬品の発見のような多くの応用に役立つだろう。
いくつかのツールが利用可能であり、主に光学的文字認識から派生している。
しかし,これらのツールの性能評価により,正しい結合多重性や立体化学情報の検出に誤りがしばしば生じていることが判明した。
さらに、エラーは結果として生じるグラフの原子の欠如につながることもある。
本研究では,機械学習に基づく複合認識手法を開発し,これらの課題に対処する。
具体的には,光複合認識のための深層ニューラルネットワークモデルを開発した。
ここで提示されるディープラーニングソリューションはセグメンテーションモデルで構成され、続いて原子の位置、結合、電荷を予測する3つの分類モデルが続く。
さらに、このモデルは分子のグラフ構造を予測するだけでなく、結果のグラフの各コンポーネントとソースイメージを関連付けるために必要な情報も生成する。
このソリューションはスケーラブルで、数千のイメージを迅速に処理できる。
最後に,提案手法を確立したツールと比較し,有意な誤差低減を観測する。
関連論文リスト
- MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Conditional Graph Information Bottleneck for Molecular Relational
Learning [9.56625683182106]
本稿では,コア部分グラフを検出してグラフ間の相互作用を予測できる新しい関係学習フレームワークCGIBを提案する。
提案手法は化学反応の性質,すなわち分子の核部分構造がどの分子と相互作用するかによって異なることを模倣する。
論文 参考訳(メタデータ) (2023-04-29T01:17:43Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Rxn Hypergraph: a Hypergraph Attention Model for Chemical Reaction
Representation [70.97737157902947]
現在、化学反応を強固に表現するための普遍的で広く採用されている方法は存在しない。
ここでは、グラフに基づく分子構造の表現を利用して、ハイパーグラフアテンションニューラルネットワークアプローチを開発し、テストする。
我々はこのハイパーグラフ表現を3つの独立な化学反応データセットを用いて3つの実験で評価した。
論文 参考訳(メタデータ) (2022-01-02T12:33:10Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - BERT Learns (and Teaches) Chemistry [5.653789128055942]
そこで本研究では,データ駆動の観点から,機能基および他の特性に影響を及ぼす分子サブ構造の研究に注意を払わせることを提案する。
次に, モデルで学習した官能基と原子の表現を適用し, 毒性, 溶解度, 薬物類似性, アクセシビリティの問題に対処する。
論文 参考訳(メタデータ) (2020-07-11T00:23:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。