論文の概要: MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition
- arxiv url: http://arxiv.org/abs/2403.03691v3
- Date: Wed, 28 Aug 2024 03:57:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-29 20:59:10.384404
- Title: MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition
- Title(参考訳): MolNexTR:分子画像認識のための一般化ディープラーニングモデル
- Authors: Yufan Chen, Ching Ting Leung, Yong Huang, Jianwei Sun, Hao Chen, Hanyu Gao,
- Abstract要約: MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
テストセットでは, MolNexTR が優れた性能を示し,81~97% の精度を達成した。
- 参考スコア(独自算出の注目度): 4.510482519069965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of chemical structure recognition, the task of converting molecular images into machine-readable data formats such as SMILES string stands as a significant challenge, primarily due to the varied drawing styles and conventions prevalent in chemical literature. To bridge this gap, we proposed MolNexTR, a novel image-to-graph deep learning model that collaborates to fuse the strengths of ConvNext, a powerful Convolutional Neural Network variant, and Vision-TRansformer. This integration facilitates a more detailed extraction of both local and global features from molecular images. MolNexTR can predict atoms and bonds simultaneously and understand their layout rules. It also excels at flexibly integrating symbolic chemistry principles to discern chirality and decipher abbreviated structures. We further incorporate a series of advanced algorithms, including an improved data augmentation module, an image contamination module, and a post-processing module for getting the final SMILES output. These modules cooperate to enhance the model's robustness to diverse styles of molecular images found in real literature. In our test sets, MolNexTR has demonstrated superior performance, achieving an accuracy rate of 81-97%, marking a significant advancement in the domain of molecular structure recognition.
- Abstract(参考訳): 化学構造認識の分野では、分子画像をSMILES文字列などの機械可読データ形式に変換するタスクは、主に化学文献で広く見られる様々な描画スタイルや規則のために重要な課題である。
このギャップを埋めるため、我々は、強力な畳み込みニューラルネットワークであるConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフ深層学習モデルであるMolNexTRを提案した。
この統合により、分子画像から局所的特徴と大域的特徴の両方をより詳細に抽出することができる。
MolNexTRは原子と結合を同時に予測し、それらの配置規則を理解することができる。
また、シンボリック化学の原理を柔軟に統合し、キラリティを識別し、短縮構造を解読する能力も優れている。
さらに、改良されたデータ拡張モジュール、画像汚染モジュール、最終的なSMILES出力を得るための後処理モジュールを含む、一連の高度なアルゴリズムを組み込んだ。
これらのモジュールは、実際の文献に見られる多様な分子画像のスタイルに対するモデルの堅牢性を高めるために協力する。
本試験では, 分子構造認識の領域において, 81~97%の精度を達成し, 優れた性能を示した。
関連論文リスト
- MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文 参考訳(メタデータ) (2022-05-28T03:03:45Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z) - Improved Conditional Flow Models for Molecule to Image Synthesis [37.886816307827196]
Mol2Imageは、分子から細胞への画像合成のためのフローベース生成モデルである。
セル特徴を異なる解像度で生成し,高解像度画像にスケールするために,我々は新しいマルチスケールフローアーキテクチャを開発した。
生成した画像と分子介入の相互情報を最大化するために,コントラスト学習に基づくトレーニング戦略を考案した。
論文 参考訳(メタデータ) (2020-06-15T16:39:50Z) - Multi-View Graph Neural Networks for Molecular Property Prediction [67.54644592806876]
マルチビューグラフニューラルネットワーク(MV-GNN)を提案する。
MV-GNNでは,学習過程を安定させるために,自己注意型読み出しコンポーネントと不一致損失を導入する。
我々は、相互依存型メッセージパッシング方式を提案することにより、MV-GNNの表現力をさらに強化する。
論文 参考訳(メタデータ) (2020-05-17T04:46:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。