論文の概要: SubGrapher: Visual Fingerprinting of Chemical Structures
- arxiv url: http://arxiv.org/abs/2504.19695v1
- Date: Mon, 28 Apr 2025 11:45:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.412267
- Title: SubGrapher: Visual Fingerprinting of Chemical Structures
- Title(参考訳): SubGrapher: 化学構造のビジュアルフィンガープリント
- Authors: Lucas Morin, Gerhard Ingmar Meijer, Valéry Weber, Luc Van Gool, Peter W. J. Staar,
- Abstract要約: SubGrapherは化学構造画像の視覚的フィンガープリントの手法である。
完全な分子グラフを再構築しようとする従来の光学化学構造認識(OCSR)モデルとは異なり、SubGrapherは化学構造画像から直接分子指紋を抽出することに焦点を当てている。
本手法は最先端のOCSRおよびフィンガープリント法に対して評価され,多様な分子描写における検索性能とロバスト性を向上した。
- 参考スコア(独自算出の注目度): 46.677062201188015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic extraction of chemical structures from scientific literature plays a crucial role in accelerating research across fields ranging from drug discovery to materials science. Patent documents, in particular, contain molecular information in visual form, which is often inaccessible through traditional text-based searches. In this work, we introduce SubGrapher, a method for the visual fingerprinting of chemical structure images. Unlike conventional Optical Chemical Structure Recognition (OCSR) models that attempt to reconstruct full molecular graphs, SubGrapher focuses on extracting molecular fingerprints directly from chemical structure images. Using learning-based instance segmentation, SubGrapher identifies functional groups and carbon backbones, constructing a substructure-based fingerprint that enables chemical structure retrieval. Our approach is evaluated against state-of-the-art OCSR and fingerprinting methods, demonstrating superior retrieval performance and robustness across diverse molecular depictions. The dataset, models, and code will be made publicly available.
- Abstract(参考訳): 科学文献からの化学構造の自動抽出は、薬物発見から物質科学まで幅広い分野の研究を加速させる重要な役割を担っている。
特に特許文書には視覚的な分子情報が含まれており、しばしば従来のテキストベースの検索ではアクセスできない。
本稿では,化学構造画像の視覚的フィンガープリント手法であるSubGrapherを紹介する。
完全な分子グラフを再構築しようとする従来の光学化学構造認識(OCSR)モデルとは異なり、SubGrapherは化学構造画像から直接分子指紋を抽出することに焦点を当てている。
SubGrapherは、学習ベースのインスタンスセグメンテーションを使用して、機能グループと炭素のバックボーンを特定し、化学構造検索を可能にするサブ構造ベースの指紋を構築する。
本手法は最先端のOCSRおよびフィンガープリント法に対して評価され,多様な分子描写における検索性能とロバスト性を向上した。
データセット、モデル、コードは公開されます。
関連論文リスト
- MarkushGrapher: Joint Visual and Textual Recognition of Markush Structures [47.41884299076947]
MarkushGrapherは、ドキュメント内のMarkush構造を認識するためのマルチモーダルアプローチである。
本稿では,多種多様な現実的なマルコシュ構造を生成する合成データ生成パイプラインを提案する。
M2Sは、実世界のMarkush構造の最初の注釈付きベンチマークである。
論文 参考訳(メタデータ) (2025-03-20T12:40:38Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - MolParser: End-to-end Visual Recognition of Molecule Structures in the Wild [23.558032054114577]
両端から端までの新しい化学構造認識法であるモールについて述べる。
SMILES符号化法を用いて,最大のアノテート分子画像データセットである Mol-7M をアノテートする。
我々は、カリキュラム学習アプローチを用いて、エンドツーエンドの分子画像キャプションモデル、Molを訓練した。
論文 参考訳(メタデータ) (2024-11-17T15:00:09Z) - GraphXForm: Graph transformer for computer-aided molecular design [73.1842164721868]
既存の化合物を事前訓練したデコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormを提案する。
種々の薬物設計タスクで評価し、最先端の分子設計手法と比較して優れた客観的スコアを示す。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - SMiCRM: A Benchmark Dataset of Mechanistic Molecular Images [0.8192907805418583]
本稿では,アロープッシングアノテーションを用いた化学分子の機械認識能力をベンチマークするためのデータセットを提案する。
このデータセットには、各画像に対する機械可読な分子アイデンティティと、化学反応中に電子の流れを示す機械的矢印が含まれている。
論文 参考訳(メタデータ) (2024-07-25T18:52:10Z) - Expanding Chemical Representation with k-mers and Fragment-based Fingerprints for Molecular Fingerprinting [4.588028371034407]
本研究では,サブストラクチャカウント,$k$-mers,Daylightのような指紋を組み合わせることで,SMILES文字列の化学構造の表現を拡大する手法を提案する。
本発明の統合方法は、識別力及び情報内容を高める包括的分子埋め込みを生成する。
論文 参考訳(メタデータ) (2024-03-28T21:36:07Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Image-to-Graph Transformers for Chemical Structure Recognition [4.180435324231826]
画像から分子構造を抽出する深層学習モデルを提案する。
提案モデルは,分子画像を直接対応するグラフに変換するように設計されている。
エンド・ツー・エンドの学習アプローチにより、様々なソースからの多くのオープン画像と分子のペアデータを完全に活用することができる。
論文 参考訳(メタデータ) (2022-02-19T11:33:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。