論文の概要: MolMiner: You only look once for chemical structure recognition
- arxiv url: http://arxiv.org/abs/2205.11016v1
- Date: Mon, 23 May 2022 03:16:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 13:16:05.026814
- Title: MolMiner: You only look once for chemical structure recognition
- Title(参考訳): MolMiner: 化学構造認識は一度だけ
- Authors: Youjun Xu, Jinchuan Xiao, Chia-Han Chou, Jianhang Zhang, Jintao Zhu,
Qiwan Hu, Hemin Li, Ningsheng Han, Bingyu Liu, Shuaipeng Zhang, Jinyu Han,
Zhen Zhang, Shuhao Zhang, Weilin Zhang, Luhua Lai, Jianfeng Pei
- Abstract要約: MolMinerは、深層ニューラルネットワークを使って、ドキュメントから原子と結合要素を認識する。
我々は,4つのベンチマークデータセットに対して,最先端のパフォーマンスでソフトウェアを評価した。
- 参考スコア(独自算出の注目度): 8.400423040504993
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Molecular structures are always depicted as 2D printed form in scientific
documents like journal papers and patents. However, these 2D depictions are not
machine-readable. Due to a backlog of decades and an increasing amount of these
printed literature, there is a high demand for the translation of printed
depictions into machine-readable formats, which is known as Optical Chemical
Structure Recognition (OCSR). Most OCSR systems developed over the last three
decades follow a rule-based approach where the key step of vectorization of the
depiction is based on the interpretation of vectors and nodes as bonds and
atoms. Here, we present a practical software MolMiner, which is primarily built
up using deep neural networks originally developed for semantic segmentation
and object detection to recognize atom and bond elements from documents. These
recognized elements can be easily connected as a molecular graph with
distance-based construction algorithm. We carefully evaluate our software on
four benchmark datasets with the state-of-the-art performance. Various real
application scenarios are also tested, yielding satisfactory outcomes. The free
download links of Mac and Windows versions are available: Mac:
https://molminer-cdn.iipharma.cn/pharma-mind/artifact/latest/mac/PharmaMind-mac-latest-setup.dmg
and Windows:
https://molminer-cdn.iipharma.cn/pharma-mind/artifact/latest/win/PharmaMind-win-latest-setup.exe
- Abstract(参考訳): 分子構造は、常に論文や特許などの科学文書に2Dプリント形式として描かれる。
しかし、これらの2D描写は機械で読めない。
数十年のバックログと、これらの印刷された文献の量の増加により、印刷された描写を機械可読形式に翻訳する需要が高く、OCSR(Opto Chemical Structure Recognition)と呼ばれる。
過去30年間に開発されたほとんどのOCSRシステムは、ベクトル化の鍵となるステップが結合と原子としてのベクトルとノードの解釈に基づいている規則に基づくアプローチに従っている。
本稿では,セマンティックセグメンテーションとオブジェクト検出のために開発された深層ニューラルネットワークを用いて,文書からアトムとボンド要素を認識する実用的なソフトウェアモルミナーを提案する。
これらの認識された要素は、距離ベース構築アルゴリズムで容易に分子グラフとして接続できる。
4つのベンチマークデータセットでソフトウェアを注意深く評価し、最新性能を確認しました。
さまざまな実際のアプリケーションシナリオもテストされ、十分な結果が得られる。
Mac: https://molminer-cdn.iipharma.cn/pharma-mind/artifact/latest/mac/PharmaMind-mac-latest-setup.dmg and Windows: https://molminer-cdn.iipharma.cn/pharma-mind/artifact/latest/win/PharmaMind-win-latest-setup.dmg and Windows
関連論文リスト
- MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.78185449646608]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - ChemScraper: Leveraging PDF Graphics Instructions for Molecular Diagram Parsing [2.806036757331682]
本稿では,デジタルPDFプリミティブを入力として利用する新しいモデルを提案する。
モデルは高速で正確であり、光学文字認識(OCR)やベクトル化を必要としない。
画像のアノテートにパーシングを使用し、画像中の分子を認識するために新しいマルチタスクニューラルネットワークを訓練する。
論文 参考訳(メタデータ) (2023-11-20T20:27:42Z) - Rethinking Tokenizer and Decoder in Masked Graph Modeling for Molecules [81.05116895430375]
マスク付きグラフモデリングは、分子グラフの自己教師付き表現学習において優れている。
サブグラフレベルのトークン化器とremaskデコーディングを備えた十分表現力のあるデコーダがエンコーダの表現学習に大きな影響を与えることを示す。
我々は,単純なGNNベースのTokenizer(SGT)と効果的な復号化戦略を備えた,新しいMGM手法SimSGTを提案する。
論文 参考訳(メタデータ) (2023-10-23T09:40:30Z) - MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and
Uni-Modal Adapter [91.77292826067465]
言語モデル(LM)は、様々な1Dテキスト関連タスクにおいて、印象的な分子理解能力を示す。
しかし、それらは本質的に2次元グラフの認識を欠いている。
クロスモーダルプロジェクタとユニモーダルアダプタを用いた分子グラフ言語モデリング(MolCA: Molecular Graph-Language Modeling)を提案する。
論文 参考訳(メタデータ) (2023-10-19T14:52:58Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - MolGraph: a Python package for the implementation of molecular graphs
and graph neural networks with TensorFlow and Keras [51.92255321684027]
MolGraphは、分子機械学習(ML)のためのグラフニューラルネットワーク(GNN)パッケージである
MolGraphは、分子ML問題を解決するためにGNNアルゴリズムに渡すことができる小さな分子グラフを生成するための化学モジュールを実装している。
GNNは分子識別に有用であり,クロマトグラフィー保持時間データの解釈性が向上した。
論文 参考訳(メタデータ) (2022-08-21T18:37:41Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Pharmacoprint -- a combination of pharmacophore fingerprint and
artificial intelligence as a tool for computer-aided drug design [6.053347262128918]
我々はPharmacoprintと呼ばれる高分解能の医薬品用指紋を提案する。
分子の存在、型、および分子の薬理泳動の特徴の間の関係をコードする。
論文 参考訳(メタデータ) (2021-10-04T11:36:39Z) - Dual-view Molecule Pre-training [186.07333992384287]
デュアルビュー分子事前学習は、両方のタイプの分子表現の強さを効果的に組み合わせることができる。
DMPは9つの分子特性予測タスクでテストされ、そのうち7つで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-06-17T03:58:38Z) - Augmenting Molecular Images with Vector Representations as a
Featurization Technique for Drug Classification [4.873362301533825]
本稿では,分子画像だけでは含まれない,あるいは容易に理解できない情報を符号化するバイナリベクトルを付加した分子画像の作成を提案する。
HIVウイルスを阻害すると41,127個の分子がラベル付けされたパンデ研究所で公表されたHIVデータセット上で,本手法を試験した。
論文 参考訳(メタデータ) (2020-08-09T04:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。