論文の概要: Robust Molecular Image Recognition: A Graph Generation Approach
- arxiv url: http://arxiv.org/abs/2205.14311v1
- Date: Sat, 28 May 2022 03:03:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 14:24:13.201954
- Title: Robust Molecular Image Recognition: A Graph Generation Approach
- Title(参考訳): ロバストな分子画像認識:グラフ生成アプローチ
- Authors: Yujie Qian, Zhengkai Tu, Jiang Guo, Connor W. Coley, Regina Barzilay
- Abstract要約: 分子画像認識は、化学文献からの情報抽出の基本的な課題である。
従来のデータ駆動モデルは、これを画像からシーケンスへのタスクとして定式化し、分子のシーケンシャルな表現を生成する。
分子グラフを構築するために,原子と結合と幾何学的レイアウトを明示的に予測する新しいグラフ生成手法を提案する。
- 参考スコア(独自算出の注目度): 31.04305234247186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular image recognition is a fundamental task in information extraction
from chemistry literature. Previous data-driven models formulate it as an
image-to-sequence task, to generate a sequential representation of the molecule
(e.g. SMILES string) from its graphical representation. Although they perform
adequately on certain benchmarks, these models are not robust in real-world
situations, where molecular images differ in style, quality, and chemical
patterns. In this paper, we propose a novel graph generation approach that
explicitly predicts atoms and bonds, along with their geometric layouts, to
construct the molecular graph. We develop data augmentation strategies for
molecules and images to increase the robustness of our model against domain
shifts. Our model is flexible to incorporate chemistry constraints, and
produces more interpretable predictions than SMILES. In experiments on both
synthetic and realistic molecular images, our model significantly outperforms
previous models, achieving 84-93% accuracy on five benchmarks. We also conduct
human evaluation and show that our model reduces the time for a chemist to
extract molecular structures from images by roughly 50%.
- Abstract(参考訳): 分子画像認識は化学文献からの情報抽出における基本課題である。
以前のデータ駆動モデルは、それを画像からシーケンスへのタスクとして定式化し、そのグラフィカル表現から分子(例えば、スマイル弦)のシーケンシャルな表現を生成する。
特定のベンチマークで適切に機能するが、これらのモデルは、分子画像がスタイル、品質、化学パターンが異なる現実世界では堅牢ではない。
本稿では,分子グラフを構成するために,原子と結合とその幾何学的レイアウトを明示的に予測する新しいグラフ生成手法を提案する。
我々は、ドメインシフトに対するモデルの堅牢性を高めるために、分子と画像のデータ強化戦略を開発する。
我々のモデルは化学制約を組み込む柔軟性があり、SMILESよりも解釈可能な予測を生成する。
合成および現実的な分子画像を用いた実験では,5つのベンチマークで84-93%の精度を得た。
また, 人による評価を行い, 化学者が画像から分子構造を抽出するのに要する時間を約50%短縮することを示した。
関連論文リスト
- MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition [4.7793786389946815]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
MolNexTRは81-97%の精度で優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework
Based on Image and Graph Structures [2.792611146246963]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and
Uni-Modal Adapter [91.77292826067465]
言語モデル(LM)は、様々な1Dテキスト関連タスクにおいて、印象的な分子理解能力を示す。
しかし、それらは本質的に2次元グラフの認識を欠いている。
クロスモーダルプロジェクタとユニモーダルアダプタを用いた分子グラフ言語モデリング(MolCA: Molecular Graph-Language Modeling)を提案する。
論文 参考訳(メタデータ) (2023-10-19T14:52:58Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文 参考訳(メタデータ) (2023-08-14T03:12:29Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - MolXPT: Wrapping Molecules with Text for Generative Pre-training [141.0924452870112]
MolXPTは、テキストでラップされたSMILESで事前訓練されたテキストと分子の統一言語モデルである。
MolXPT は MoleculeNet 上での分子特性予測の強いベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-18T03:58:19Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。