論文の概要: Robust Molecular Image Recognition: A Graph Generation Approach
- arxiv url: http://arxiv.org/abs/2205.14311v1
- Date: Sat, 28 May 2022 03:03:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 14:24:13.201954
- Title: Robust Molecular Image Recognition: A Graph Generation Approach
- Title(参考訳): ロバストな分子画像認識:グラフ生成アプローチ
- Authors: Yujie Qian, Zhengkai Tu, Jiang Guo, Connor W. Coley, Regina Barzilay
- Abstract要約: 分子画像認識は、化学文献からの情報抽出の基本的な課題である。
従来のデータ駆動モデルは、これを画像からシーケンスへのタスクとして定式化し、分子のシーケンシャルな表現を生成する。
分子グラフを構築するために,原子と結合と幾何学的レイアウトを明示的に予測する新しいグラフ生成手法を提案する。
- 参考スコア(独自算出の注目度): 31.04305234247186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular image recognition is a fundamental task in information extraction
from chemistry literature. Previous data-driven models formulate it as an
image-to-sequence task, to generate a sequential representation of the molecule
(e.g. SMILES string) from its graphical representation. Although they perform
adequately on certain benchmarks, these models are not robust in real-world
situations, where molecular images differ in style, quality, and chemical
patterns. In this paper, we propose a novel graph generation approach that
explicitly predicts atoms and bonds, along with their geometric layouts, to
construct the molecular graph. We develop data augmentation strategies for
molecules and images to increase the robustness of our model against domain
shifts. Our model is flexible to incorporate chemistry constraints, and
produces more interpretable predictions than SMILES. In experiments on both
synthetic and realistic molecular images, our model significantly outperforms
previous models, achieving 84-93% accuracy on five benchmarks. We also conduct
human evaluation and show that our model reduces the time for a chemist to
extract molecular structures from images by roughly 50%.
- Abstract(参考訳): 分子画像認識は化学文献からの情報抽出における基本課題である。
以前のデータ駆動モデルは、それを画像からシーケンスへのタスクとして定式化し、そのグラフィカル表現から分子(例えば、スマイル弦)のシーケンシャルな表現を生成する。
特定のベンチマークで適切に機能するが、これらのモデルは、分子画像がスタイル、品質、化学パターンが異なる現実世界では堅牢ではない。
本稿では,分子グラフを構成するために,原子と結合とその幾何学的レイアウトを明示的に予測する新しいグラフ生成手法を提案する。
我々は、ドメインシフトに対するモデルの堅牢性を高めるために、分子と画像のデータ強化戦略を開発する。
我々のモデルは化学制約を組み込む柔軟性があり、SMILESよりも解釈可能な予測を生成する。
合成および現実的な分子画像を用いた実験では,5つのベンチマークで84-93%の精度を得た。
また, 人による評価を行い, 化学者が画像から分子構造を抽出するのに要する時間を約50%短縮することを示した。
関連論文リスト
- MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。
ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。
我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2024-07-09T01:14:28Z) - MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition [4.510482519069965]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
テストセットでは, MolNexTR が優れた性能を示し,81~97% の精度を達成した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - MolXPT: Wrapping Molecules with Text for Generative Pre-training [141.0924452870112]
MolXPTは、テキストでラップされたSMILESで事前訓練されたテキストと分子の統一言語モデルである。
MolXPT は MoleculeNet 上での分子特性予測の強いベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-18T03:58:19Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。