論文の概要: MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition
- arxiv url: http://arxiv.org/abs/2403.03691v1
- Date: Wed, 6 Mar 2024 13:17:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 15:07:20.304331
- Title: MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition
- Title(参考訳): MolNexTR:分子画像認識のための一般化ディープラーニングモデル
- Authors: Yufan Chen, Ching Ting Leung, Yong Huang, Jianwei Sun, Hao Chen, Hanyu
Gao
- Abstract要約: MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
MolNexTRは81-97%の精度で優れた性能を示した。
- 参考スコア(独自算出の注目度): 4.7793786389946815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of chemical structure recognition, the task of converting
molecular images into graph structures and SMILES string stands as a
significant challenge, primarily due to the varied drawing styles and
conventions prevalent in chemical literature. To bridge this gap, we proposed
MolNexTR, a novel image-to-graph deep learning model that collaborates to fuse
the strengths of ConvNext, a powerful Convolutional Neural Network variant, and
Vision-TRansformer. This integration facilitates a more nuanced extraction of
both local and global features from molecular images. MolNexTR can predict
atoms and bonds simultaneously and understand their layout rules. It also
excels at flexibly integrating symbolic chemistry principles to discern
chirality and decipher abbreviated structures. We further incorporate a series
of advanced algorithms, including improved data augmentation module, image
contamination module, and a post-processing module to get the final SMILES
output. These modules synergistically enhance the model's robustness against
the diverse styles of molecular imagery found in real literature. In our test
sets, MolNexTR has demonstrated superior performance, achieving an accuracy
rate of 81-97%, marking a significant advancement in the domain of molecular
structure recognition. Scientific contribution: MolNexTR is a novel
image-to-graph model that incorporates a unique dual-stream encoder to extract
complex molecular image features, and combines chemical rules to predict atoms
and bonds while understanding atom and bond layout rules. In addition, it
employs a series of novel augmentation algorithms to significantly enhance the
robustness and performance of the model.
- Abstract(参考訳): 化学構造認識の分野では、分子像をグラフ構造やスマイルストリングに変換する作業は、主に化学文献に共通する様々な描画スタイルや慣習のために、重要な課題となっている。
このギャップを埋めるため、我々は、強力な畳み込みニューラルネットワークであるConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフ深層学習モデルであるMolNexTRを提案した。
この統合により、分子画像からの局所的特徴と大域的特徴のより微妙な抽出が促進される。
MolNexTRは原子と結合を同時に予測し、それらの配置規則を理解することができる。
また、シンボリック化学の原理を柔軟に統合し、キラリティを識別し、短縮構造を解読する。
さらに,改良されたデータ拡張モジュール,イメージ汚染モジュール,および最終的なスマイル出力を得るための後処理モジュールなど,一連の高度なアルゴリズムを組み込んだ。
これらのモジュールは、実文献に見られる多様な分子イメージのスタイルに対するモデルの強固さを相乗的に強化する。
本試験では, 分子構造認識の領域において, 81~97%の精度を達成し, 優れた性能を示した。
科学的な貢献: MolNexTRは、ユニークなデュアルストリームエンコーダを組み込んで複雑な分子画像の特徴を抽出し、化学規則を組み合わせて原子と結合を予測し、原子と結合配置の規則を理解している。
さらに、モデルの堅牢性と性能を大幅に向上させるために、一連の新しい拡張アルゴリズムを採用している。
関連論文リスト
- MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-28T03:03:45Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z) - Improved Conditional Flow Models for Molecule to Image Synthesis [37.886816307827196]
Mol2Imageは、分子から細胞への画像合成のためのフローベース生成モデルである。
セル特徴を異なる解像度で生成し,高解像度画像にスケールするために,我々は新しいマルチスケールフローアーキテクチャを開発した。
生成した画像と分子介入の相互情報を最大化するために,コントラスト学習に基づくトレーニング戦略を考案した。
論文 参考訳(メタデータ) (2020-06-15T16:39:50Z) - Multi-View Graph Neural Networks for Molecular Property Prediction [67.54644592806876]
マルチビューグラフニューラルネットワーク(MV-GNN)を提案する。
MV-GNNでは,学習過程を安定させるために,自己注意型読み出しコンポーネントと不一致損失を導入する。
我々は、相互依存型メッセージパッシング方式を提案することにより、MV-GNNの表現力をさらに強化する。
論文 参考訳(メタデータ) (2020-05-17T04:46:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。