Fugu-MT 論文翻訳(概要): Image-to-Graph Transformers for Chemical Structure Recognition

論文の概要: Image-to-Graph Transformers for Chemical Structure Recognition

arxiv url: http://arxiv.org/abs/2202.09580v1
Date: Sat, 19 Feb 2022 11:33:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-22 16:29:32.514945
Title: Image-to-Graph Transformers for Chemical Structure Recognition
Title（参考訳）: 化学構造認識のための画像-グラフ変換器
Authors: Sanghyun Yoo, Ohyun Kwon, Hoshik Lee
Abstract要約: 画像から分子構造を抽出する深層学習モデルを提案する。提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
参考スコア（独自算出の注目度）: 4.180435324231826
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: For several decades, chemical knowledge has been published in written text, and there have been many attempts to make it accessible, for example, by transforming such natural language text to a structured format. Although the discovered chemical itself commonly represented in an image is the most important part, the correct recognition of the molecular structure from the image in literature still remains a hard problem since they are often abbreviated to reduce the complexity and drawn in many different styles. In this paper, we present a deep learning model to extract molecular structures from images. The proposed model is designed to transform the molecular image directly into the corresponding graph, which makes it capable of handling non-atomic symbols for abbreviations. Also, by end-to-end learning approach it can fully utilize many open image-molecule pair data from various sources, and hence it is more robust to image style variation than other tools. The experimental results show that the proposed model outperforms the existing models with 17.1 % and 12.8 % relative improvement for well-known benchmark datasets and large molecular images that we collected from literature, respectively.
Abstract（参考訳）: 何十年もの間、化学知識はテキストで出版され、例えばそのような自然言語のテキストを構造化形式に変換するなど、多くの試みがなされてきた。画像で一般的に表現される発見化学物質は最も重要な部分であるが、文学における画像からの分子構造の正しい認識は、しばしば複雑さを減らし、多くの異なるスタイルで描画されるため、難しい問題である。本稿では,画像から分子構造を抽出するための深層学習モデルを提案する。提案モデルは,分子画像を直接対応するグラフに変換するように設計されており,非原子記号を略語として扱うことができる。また、エンド・ツー・エンドの学習アプローチでは、様々なソースから多くのオープンイメージと分子のペアデータを完全に活用できるため、他のツールよりも画像スタイルの変動に対して堅牢である。実験の結果,本モデルでは,文献から収集したベンチマークデータセットと大規模分子画像に対して,既存のモデルよりも17.1 %と12.8 %の相対的改善が得られた。

関連論文リスト

RxnCaption: Reformulating Reaction Diagram Parsing as Visual Prompt Guided Captioning [51.393018266721576]
化学反応図解析(RxnDP)のためのRxnCaptionフレームワークを提案する。本フレームワークは,従来の座標予測による解析処理を画像キャプション問題に再構成する。我々は,BBox and Index as Visual Prompt (BIVP) という,最先端の分子検出器である MolYOLO を用いて,分子境界ボックスやインデックスを直接入力画像上に描画する戦略を紹介した。
論文参考訳（メタデータ） (2025-11-04T09:08:44Z)
SubGrapher: Visual Fingerprinting of Chemical Structures [46.677062201188015]
SubGrapherは化学構造画像の視覚的フィンガープリントの手法である。完全な分子グラフを再構築しようとする従来の光学化学構造認識(OCSR)モデルとは異なり、SubGrapherは化学構造画像から直接分子指紋を抽出することに焦点を当てている。本手法は最先端のOCSRおよびフィンガープリント法に対して評価され,多様な分子描写における検索性能とロバスト性を向上した。
論文参考訳（メタデータ） (2025-04-28T11:45:46Z)
MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。 SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文参考訳（メタデータ） (2024-11-17T15:00:09Z)
GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文参考訳（メタデータ） (2024-11-03T19:45:15Z)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (2024-05-05T08:35:23Z)
MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition [4.510482519069965]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。テストセットでは, MolNexTR が優れた性能を示し,81～97% の精度を達成した。
論文参考訳（メタデータ） (2024-03-06T13:17:41Z)
MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。すべての候補原子と結合をノードとして扱い、それらをグラフ化する。グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文参考訳（メタデータ） (2023-08-23T16:16:11Z)
GIT-Mol: A Multi-modal Large Language Model for Molecular Science with Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文参考訳（メタデータ） (2023-08-14T03:12:29Z)
A Molecular Multimodal Foundation Model Associating Molecule Graphs with Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文参考訳（メタデータ） (2022-09-12T00:56:57Z)
MolScribe: Robust Molecular Structure Recognition with Image-To-Graph Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。 MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文参考訳（メタデータ） (2022-05-28T03:03:45Z)
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding [53.170767750244366]
Imagenは、前例のないフォトリアリズムと深い言語理解を備えたテキスト間拡散モデルである。テキスト・ツー・イメージ・モデルをより深く評価するために,テキスト・ツー・イメージ・モデルの総合的かつ挑戦的なベンチマークであるDrawBenchを紹介した。
論文参考訳（メタデータ） (2022-05-23T17:42:53Z)
Conditional Constrained Graph Variational Autoencoders for Molecule Design [70.59828655929194]
本稿では、このキーイデアを最先端のモデルで実装した、条件制約付きグラフ変分オートエンコーダ(CCGVAE)を提案する。分子生成のために広く採用されている2つのデータセットについて、いくつかの評価指標について改善した結果を示す。
論文参考訳（メタデータ） (2020-09-01T21:58:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。