論文の概要: Image-to-Graph Transformers for Chemical Structure Recognition
- arxiv url: http://arxiv.org/abs/2202.09580v1
- Date: Sat, 19 Feb 2022 11:33:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-22 16:29:32.514945
- Title: Image-to-Graph Transformers for Chemical Structure Recognition
- Title(参考訳): 化学構造認識のための画像-グラフ変換器
- Authors: Sanghyun Yoo, Ohyun Kwon, Hoshik Lee
- Abstract要約: 画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
- 参考スコア(独自算出の注目度): 4.180435324231826
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: For several decades, chemical knowledge has been published in written text,
and there have been many attempts to make it accessible, for example, by
transforming such natural language text to a structured format. Although the
discovered chemical itself commonly represented in an image is the most
important part, the correct recognition of the molecular structure from the
image in literature still remains a hard problem since they are often
abbreviated to reduce the complexity and drawn in many different styles. In
this paper, we present a deep learning model to extract molecular structures
from images. The proposed model is designed to transform the molecular image
directly into the corresponding graph, which makes it capable of handling
non-atomic symbols for abbreviations. Also, by end-to-end learning approach it
can fully utilize many open image-molecule pair data from various sources, and
hence it is more robust to image style variation than other tools. The
experimental results show that the proposed model outperforms the existing
models with 17.1 % and 12.8 % relative improvement for well-known benchmark
datasets and large molecular images that we collected from literature,
respectively.
- Abstract(参考訳): 何十年もの間、化学知識はテキストで出版され、例えばそのような自然言語のテキストを構造化形式に変換するなど、多くの試みがなされてきた。
画像で一般的に表現される発見化学物質は最も重要な部分であるが、文学における画像からの分子構造の正しい認識は、しばしば複雑さを減らし、多くの異なるスタイルで描画されるため、難しい問題である。
本稿では,画像から分子構造を抽出するための深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されており,非原子記号を略語として扱うことができる。
また、エンド・ツー・エンドの学習アプローチでは、様々なソースから多くのオープンイメージと分子のペアデータを完全に活用できるため、他のツールよりも画像スタイルの変動に対して堅牢である。
実験の結果,本モデルでは,文献から収集したベンチマークデータセットと大規模分子画像に対して,既存のモデルよりも17.1 %と12.8 %の相対的改善が得られた。
関連論文リスト
- MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition [4.7793786389946815]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
MolNexTRは81-97%の精度で優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文 参考訳(メタデータ) (2023-08-14T03:12:29Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Re-Imagen: Retrieval-Augmented Text-to-Image Generator [58.60472701831404]
検索用テキスト・ツー・イメージ・ジェネレータ(再画像)
検索用テキスト・ツー・イメージ・ジェネレータ(再画像)
論文 参考訳(メタデータ) (2022-09-29T00:57:28Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-28T03:03:45Z) - Photorealistic Text-to-Image Diffusion Models with Deep Language
Understanding [53.170767750244366]
Imagenは、前例のないフォトリアリズムと深い言語理解を備えたテキスト間拡散モデルである。
テキスト・ツー・イメージ・モデルをより深く評価するために,テキスト・ツー・イメージ・モデルの総合的かつ挑戦的なベンチマークであるDrawBenchを紹介した。
論文 参考訳(メタデータ) (2022-05-23T17:42:53Z) - Translation between Molecules and Natural Language [43.518805086280466]
本稿では,未ラベルの自然言語テキストや分子文字列の事前学習のための自己教師型学習フレームワークを提案する。
$textbfMolT5$は、分子キャプションやテキストベースのdenovo分子生成など、従来の視覚言語タスクの新しい、有用な、挑戦的なアナログを可能にする。
論文 参考訳(メタデータ) (2022-04-25T17:48:09Z) - Conditional Constrained Graph Variational Autoencoders for Molecule
Design [70.59828655929194]
本稿では、このキーイデアを最先端のモデルで実装した、条件制約付きグラフ変分オートエンコーダ(CCGVAE)を提案する。
分子生成のために広く採用されている2つのデータセットについて、いくつかの評価指標について改善した結果を示す。
論文 参考訳(メタデータ) (2020-09-01T21:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。