論文の概要: MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation
- arxiv url: http://arxiv.org/abs/2205.14311v2
- Date: Mon, 20 Mar 2023 23:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 04:16:17.864597
- Title: MolScribe: Robust Molecular Structure Recognition with Image-To-Graph
Generation
- Title(参考訳): MolScribe:イメージ・ツー・グラフ生成によるロバスト分子構造認識
- Authors: Yujie Qian, Jiang Guo, Zhengkai Tu, Zhening Li, Connor W. Coley,
Regina Barzilay
- Abstract要約: MolScribeは、分子構造を構築するために、原子と結合と幾何学的レイアウトを明示的に予測する画像とグラフのモデルである。
MolScribeは以前のモデルよりも大幅に優れ、公開ベンチマークで76-93%の精度を達成した。
- 参考スコア(独自算出の注目度): 28.93523736883784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular structure recognition is the task of translating a molecular image
into its graph structure. Significant variation in drawing styles and
conventions exhibited in chemical literature poses a significant challenge for
automating this task. In this paper, we propose MolScribe, a novel
image-to-graph generation model that explicitly predicts atoms and bonds, along
with their geometric layouts, to construct the molecular structure. Our model
flexibly incorporates symbolic chemistry constraints to recognize chirality and
expand abbreviated structures. We further develop data augmentation strategies
to enhance the model robustness against domain shifts. In experiments on both
synthetic and realistic molecular images, MolScribe significantly outperforms
previous models, achieving 76-93% accuracy on public benchmarks. Chemists can
also easily verify MolScribe's prediction, informed by its confidence
estimation and atom-level alignment with the input image. MolScribe is publicly
available through Python and web interfaces:
https://github.com/thomas0809/MolScribe.
- Abstract(参考訳): 分子構造認識は、分子画像をそのグラフ構造に変換するタスクである。
化学文献に示される描画スタイルや慣習の大幅な変化は、このタスクを自動化する上で大きな課題となる。
本稿では,分子構造を構築するために,原子と結合と幾何学的レイアウトを明示的に予測する新しい画像-グラフ生成モデルMolescribeを提案する。
本モデルでは, シンボリックな化学制約を柔軟に組み込んで, キラリティを認識し, 短縮構造を拡大する。
さらに、ドメインシフトに対するモデル堅牢性を高めるために、データ拡張戦略を開発します。
合成および現実的な分子画像の両方の実験において、molscribeは以前のモデルを大きく上回り、公開ベンチマークで76-93%の精度を達成した。
化学者はまた、molscribeの予測を、その信頼度推定と入力画像との原子レベルアライメントによって容易に検証することができる。
MolScribe は Python と Web インターフェースを通じて公開されている。
関連論文リスト
- MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition [4.7793786389946815]
MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
MolNexTRは81-97%の精度で優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-06T13:17:41Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework
Based on Image and Graph Structures [2.792611146246963]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - MolCA: Molecular Graph-Language Modeling with Cross-Modal Projector and
Uni-Modal Adapter [91.77292826067465]
言語モデル(LM)は、様々な1Dテキスト関連タスクにおいて、印象的な分子理解能力を示す。
しかし、それらは本質的に2次元グラフの認識を欠いている。
クロスモーダルプロジェクタとユニモーダルアダプタを用いた分子グラフ言語モデリング(MolCA: Molecular Graph-Language Modeling)を提案する。
論文 参考訳(メタデータ) (2023-10-19T14:52:58Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [25.979382232281786]
グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文 参考訳(メタデータ) (2023-08-14T03:12:29Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - MolXPT: Wrapping Molecules with Text for Generative Pre-training [141.0924452870112]
MolXPTは、テキストでラップされたSMILESで事前訓練されたテキストと分子の統一言語モデルである。
MolXPT は MoleculeNet 上での分子特性予測の強いベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-18T03:58:19Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。