論文の概要: Image-to-Graph Transformers for Chemical Structure Recognition
- arxiv url: http://arxiv.org/abs/2202.09580v1
- Date: Sat, 19 Feb 2022 11:33:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-22 16:29:32.514945
- Title: Image-to-Graph Transformers for Chemical Structure Recognition
- Title(参考訳): 化学構造認識のための画像-グラフ変換器
- Authors: Sanghyun Yoo, Ohyun Kwon, Hoshik Lee
- Abstract要約: 画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
- 参考スコア(独自算出の注目度): 4.180435324231826
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: For several decades, chemical knowledge has been published in written text,
and there have been many attempts to make it accessible, for example, by
transforming such natural language text to a structured format. Although the
discovered chemical itself commonly represented in an image is the most
important part, the correct recognition of the molecular structure from the
image in literature still remains a hard problem since they are often
abbreviated to reduce the complexity and drawn in many different styles. In
this paper, we present a deep learning model to extract molecular structures
from images. The proposed model is designed to transform the molecular image
directly into the corresponding graph, which makes it capable of handling
non-atomic symbols for abbreviations. Also, by end-to-end learning approach it
can fully utilize many open image-molecule pair data from various sources, and
hence it is more robust to image style variation than other tools. The
experimental results show that the proposed model outperforms the existing
models with 17.1 % and 12.8 % relative improvement for well-known benchmark
datasets and large molecular images that we collected from literature,
respectively.
- Abstract(参考訳): 何十年もの間、化学知識はテキストで出版され、例えばそのような自然言語のテキストを構造化形式に変換するなど、多くの試みがなされてきた。
画像で一般的に表現される発見化学物質は最も重要な部分であるが、文学における画像からの分子構造の正しい認識は、しばしば複雑さを減らし、多くの異なるスタイルで描画されるため、難しい問題である。
本稿では,画像から分子構造を抽出するための深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されており,非原子記号を略語として扱うことができる。
また、エンド・ツー・エンドの学習アプローチでは、様々なソースから多くのオープンイメージと分子のペアデータを完全に活用できるため、他のツールよりも画像スタイルの変動に対して堅牢である。
実験の結果,本モデルでは,文献から収集したベンチマークデータセットと大規模分子画像に対して,既存のモデルよりも17.1 %と12.8 %の相対的改善が得られた。
関連論文リスト
- MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition [4.510482519069965]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
テストセットでは, MolNexTR が優れた性能を示し,81~97% の精度を達成した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文 参考訳(メタデータ) (2023-08-14T03:12:29Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-28T03:03:45Z) - Photorealistic Text-to-Image Diffusion Models with Deep Language
Understanding [53.170767750244366]
Imagenは、前例のないフォトリアリズムと深い言語理解を備えたテキスト間拡散モデルである。
テキスト・ツー・イメージ・モデルをより深く評価するために,テキスト・ツー・イメージ・モデルの総合的かつ挑戦的なベンチマークであるDrawBenchを紹介した。
論文 参考訳(メタデータ) (2022-05-23T17:42:53Z) - Conditional Constrained Graph Variational Autoencoders for Molecule
Design [70.59828655929194]
本稿では、このキーイデアを最先端のモデルで実装した、条件制約付きグラフ変分オートエンコーダ(CCGVAE)を提案する。
分子生成のために広く採用されている2つのデータセットについて、いくつかの評価指標について改善した結果を示す。
論文 参考訳(メタデータ) (2020-09-01T21:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。