Fugu-MT 論文翻訳(概要): MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition

論文の概要: MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition

arxiv url: http://arxiv.org/abs/2403.03691v2
Date: Fri, 8 Mar 2024 06:32:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-11 10:38:01.395727
Title: MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition
Title（参考訳）: MolNexTR:分子画像認識のための一般化ディープラーニングモデル
Authors: Yufan Chen, Ching Ting Leung, Yong Huang, Jianwei Sun, Hao Chen, Hanyu Gao
Abstract要約: MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。 MolNexTRは81-97%の精度で優れた性能を示した。
参考スコア（独自算出の注目度）: 4.7793786389946815
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In the field of chemical structure recognition, the task of converting molecular images into graph structures and SMILES string stands as a significant challenge, primarily due to the varied drawing styles and conventions prevalent in chemical literature. To bridge this gap, we proposed MolNexTR, a novel image-to-graph deep learning model that collaborates to fuse the strengths of ConvNext, a powerful Convolutional Neural Network variant, and Vision-TRansformer. This integration facilitates a more nuanced extraction of both local and global features from molecular images. MolNexTR can predict atoms and bonds simultaneously and understand their layout rules. It also excels at flexibly integrating symbolic chemistry principles to discern chirality and decipher abbreviated structures. We further incorporate a series of advanced algorithms, including improved data augmentation module, image contamination module, and a post-processing module to get the final SMILES output. These modules synergistically enhance the model's robustness against the diverse styles of molecular imagery found in real literature. In our test sets, MolNexTR has demonstrated superior performance, achieving an accuracy rate of 81-97%, marking a significant advancement in the domain of molecular structure recognition. Scientific contribution: MolNexTR is a novel image-to-graph model that incorporates a unique dual-stream encoder to extract complex molecular image features, and combines chemical rules to predict atoms and bonds while understanding atom and bond layout rules. In addition, it employs a series of novel augmentation algorithms to significantly enhance the robustness and performance of the model.
Abstract（参考訳）: 化学構造認識の分野では、分子像をグラフ構造やスマイルストリングに変換する作業は、主に化学文献に共通する様々な描画スタイルや慣習のために、重要な課題となっている。このギャップを埋めるため、我々は、強力な畳み込みニューラルネットワークであるConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフ深層学習モデルであるMolNexTRを提案した。この統合により、分子画像からの局所的特徴と大域的特徴のより微妙な抽出が促進される。 MolNexTRは原子と結合を同時に予測し、それらの配置規則を理解することができる。また、シンボリック化学の原理を柔軟に統合し、キラリティを識別し、短縮構造を解読する。さらに,改良されたデータ拡張モジュール,イメージ汚染モジュール,および最終的なスマイル出力を得るための後処理モジュールなど,一連の高度なアルゴリズムを組み込んだ。これらのモジュールは、実文献に見られる多様な分子イメージのスタイルに対するモデルの強固さを相乗的に強化する。本試験では, 分子構造認識の領域において, 81～97%の精度を達成し, 優れた性能を示した。科学的な貢献: MolNexTRは、ユニークなデュアルストリームエンコーダを組み込んで複雑な分子画像の特徴を抽出し、化学規則を組み合わせて原子と結合を予測し、原子と結合配置の規則を理解している。さらに、モデルの堅牢性と性能を大幅に向上させるために、一連の新しい拡張アルゴリズムを採用している。

関連論文リスト

MolSight: Optical Chemical Structure Recognition with SMILES Pretraining, Multi-Granularity Learning and Reinforcement Learning [47.029225594084345]
MolSightは総合的な学習フレームワークで、3段階のトレーニングパラダイムを採用している。我々は,MollSightが(ステレオ)化学光学構造認識における最先端性能を実現することを示す。
論文参考訳（メタデータ） (2025-11-21T15:11:47Z)
$\ ext{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-08-12T05:46:47Z)
GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition [60.76623665324548]
GTR-Mol-VLMは、2つの重要な革新を特徴とする新しいフレームワークである。シーケンシャルな原子結合予測を通じて分子グラフを段階的に解析することで、人間の推論をエミュレートする。 MolRec-BenchはOCSRにおけるグラフパーシング精度の詳細な評価のために設計された最初のベンチマークである。
論文参考訳（メタデータ） (2025-06-09T08:47:10Z)
Multi-Modal Molecular Representation Learning via Structure Awareness [19.813872931221546]
構造認識に基づくマルチモーダル自己制御分子表現事前学習フレームワーク(MMSA)を提案する。 MMSAは分子間の不変知識を活用することにより、分子グラフ表現を強化する。 MoleculeNetベンチマークで最先端のパフォーマンスを実現しており、平均的なROC-AUC改善はベースラインメソッドよりも1.8%から9.6%まで改善されている。
論文参考訳（メタデータ） (2025-05-09T08:37:29Z)
Broadening Discovery through Structural Models: Multimodal Combination of Local and Structural Properties for Predicting Chemical Features [42.203344899915464]
本研究の目的は,指紋に特化して訓練された言語モデルを開発することである。この言語モデルとグラフモデルを統合するバイモーダルアーキテクチャを導入する。この統合により、従来の戦略に比べて予測性能が大幅に向上する。
論文参考訳（メタデータ） (2025-02-25T08:53:18Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。 SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文参考訳（メタデータ） (2024-11-17T15:00:09Z)
GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文参考訳（メタデータ） (2024-11-03T19:45:15Z)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳（メタデータ） (2024-11-03T01:56:15Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (2024-05-05T08:35:23Z)
MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。両者の分子表現の強さを融合させる。ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文参考訳（メタデータ） (2023-11-28T10:28:35Z)
A Molecular Multimodal Foundation Model Associating Molecule Graphs with Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文参考訳（メタデータ） (2022-09-12T00:56:57Z)
MolScribe: Robust Molecular Structure Recognition with Image-To-Graph Generation [28.93523736883784]
MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。 MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
論文参考訳（メタデータ） (2022-05-28T03:03:45Z)
Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文参考訳（メタデータ） (2022-02-19T11:33:54Z)
Improved Conditional Flow Models for Molecule to Image Synthesis [37.886816307827196]
Mol2Imageは、分子から細胞への画像合成のためのフローベース生成モデルである。セル特徴を異なる解像度で生成し,高解像度画像にスケールするために,我々は新しいマルチスケールフローアーキテクチャを開発した。生成した画像と分子介入の相互情報を最大化するために,コントラスト学習に基づくトレーニング戦略を考案した。
論文参考訳（メタデータ） (2020-06-15T16:39:50Z)
Multi-View Graph Neural Networks for Molecular Property Prediction [67.54644592806876]
マルチビューグラフニューラルネットワーク(MV-GNN)を提案する。 MV-GNNでは,学習過程を安定させるために,自己注意型読み出しコンポーネントと不一致損失を導入する。我々は、相互依存型メッセージパッシング方式を提案することにより、MV-GNNの表現力をさらに強化する。
論文参考訳（メタデータ） (2020-05-17T04:46:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。