論文の概要: Molecular Identification from AFM images using the IUPAC Nomenclature
and Attribute Multimodal Recurrent Neural Networks
- arxiv url: http://arxiv.org/abs/2205.00449v1
- Date: Sun, 1 May 2022 11:39:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 16:30:45.653332
- Title: Molecular Identification from AFM images using the IUPAC Nomenclature
and Attribute Multimodal Recurrent Neural Networks
- Title(参考訳): IUPAC命名法と属性マルチモーダルリカレントニューラルネットワークを用いたAFM画像からの分子同定
- Authors: Jaime Carracedo-Cosme, Carlos Romero-Mu\~niz, Pablo Pou, Rub\'en
P\'erez
- Abstract要約: 本稿では,この課題に深層学習技術を用いて対処する戦略を提案する。
従来の分類法に従って有限個の分子を同定する代わりに、分子の同定を画像キャプション問題として定義する。
3D-AFM画像スタックを入力として、未知分子の構造と構成を識別できる2つのマルチモーダルリカレントニューラルネットワークからなるアーキテクチャを設計する。
ニューラルネットワークは、IUPAC命名規則に従って各分子の名前を提供するように訓練されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Despite being the main tool to visualize molecules at the atomic scale, AFM
with CO-functionalized metal tips is unable to chemically identify the observed
molecules. Here we present a strategy to address this challenging task using
deep learning techniques. Instead of identifying a finite number of molecules
following a traditional classification approach, we define the molecular
identification as an image captioning problem. We design an architecture,
composed of two multimodal recurrent neural networks, capable of identifying
the structure and composition of an unknown molecule using a 3D-AFM image stack
as input. The neural network is trained to provide the name of each molecule
according to the IUPAC nomenclature rules. To train and test this algorithm we
use the novel QUAM-AFM dataset, which contains almost 700,000 molecules and 165
million AFM images. The accuracy of the predictions is remarkable, achieving a
high score quantified by the cumulative BLEU 4-gram, a common metric in
language recognition studies.
- Abstract(参考訳): 原子スケールで分子を可視化する主要なツールであるにもかかわらず、CO官能化金属先端を持つAFMは、観察された分子を化学的に識別することができない。
本稿では,この課題に深層学習技術を用いて対処する戦略を提案する。
従来の分類アプローチに従って有限個の分子を識別するのではなく、画像キャプション問題として分子識別を定義する。
3d-afm画像スタックを入力として未知の分子の構造と構成を識別できる2つのマルチモーダルリカレントニューラルネットワークからなるアーキテクチャを設計した。
ニューラルネットワークは、IUPAC命名規則に従って各分子の名前を提供するように訓練されている。
このアルゴリズムを訓練し、テストするために、約70万の分子と1億6500万のAFM画像を含む新しいQUIM-AFMデータセットを使用します。
予測の精度は顕著であり、言語認識研究の一般的な指標である累積BLEU 4-gramによって定量化された高いスコアを達成する。
関連論文リスト
- FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - MaskMol: Knowledge-guided Molecular Image Pre-Training Framework for Activity Cliffs [18.901322124389218]
MaskMolは知識誘導型分子画像自己教師型学習フレームワークである。
MaskMolは、複数のレベルの分子知識を考慮し、分子画像の表現を正確に学習する。
その結果,MaskMolの活性崖推定および複合有効性予測における高精度かつ伝達性を示した。
論文 参考訳(メタデータ) (2024-09-02T03:03:22Z) - Molecular Identification via Molecular Fingerprint extraction from Atomic Force Microscopy images [0.0]
深層学習モデルは、一定の高さのHR-AFM画像の3Dスタックに符号化された化学情報や構造情報を検索することができる。
本研究では, トポロジカルフィンガーによる分子構造記述の確立により, それらの限界を克服する。
指紋による仮想検診を他のDLモデルによって提供されるグローバルな情報で補完することは可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T13:47:35Z) - MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition [4.510482519069965]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる、新しい画像からグラフまでのディープラーニングモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
テストセットでは, MolNexTR が優れた性能を示し,81~97% の精度を達成した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - MM-Deacon: Multimodal molecular domain embedding analysis via
contrastive learning [6.761743360275381]
MM-Deacon と呼ばれる多モード分子埋め込み生成手法を提案する。
MM-DeaconはSMILESとIUPAC分子表現を2つの異なるモードとして訓練する。
分子クラスタリング,クロスモーダル分子探索,薬物類似性評価,薬物と薬物の相互作用タスクに対する分子埋め込みの堅牢性を評価した。
論文 参考訳(メタデータ) (2021-09-18T04:46:39Z) - IMG2SMI: Translating Molecular Structure Images to Simplified
Molecular-input Line-entry System [29.946393284884778]
我々は、画像特徴抽出にDeep Residual Networksを利用するモデルIGG2SMIと、分子記述生成にエンコーダ・デコーダ・トランスフォーマ層を導入する。
IMG2SMIは、分子MACCS Fingerprint Tanimoto similarityによって測定された分子類似性予測において、OSRA系システムよりも163%優れていた。
また、分子記述生成のための8100万分子を含む新しい分子予測データセットもリリースした。
論文 参考訳(メタデータ) (2021-09-03T19:57:07Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。