論文の概要: MolRecBench-Wild: A Real-World Benchmark for Optical Chemical Structure Recognition
- arxiv url: http://arxiv.org/abs/2605.05832v1
- Date: Thu, 07 May 2026 08:08:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.617748
- Title: MolRecBench-Wild: A Real-World Benchmark for Optical Chemical Structure Recognition
- Title(参考訳): MolRecBench-Wild:光学化学構造認識のための実世界のベンチマーク
- Authors: Haote Yang, Hui Wang, Chen Zhu, Jingchao Wang, Linye Li, Hongbin Lai, Huijie Ao, Yongxuan Lyu, Jiang Wu, Jiaxing Sun, Lua Chen, Yuanyuan Cao, Ruijie Zhang, Shengxin Lu, Lijun Wu, Bin Wang, Conghui He,
- Abstract要約: 光化学構造認識は、科学文献の分子図を機械可読形式に変換することを目的としている。
分子図の視覚的干渉と化学的意味論を共同で特徴付ける,37個の細粒度ラベルを持つ2次元難易度フレームワークMOSAICを紹介する。
この枠組みに基づき、820の最近の化学論文から5,029構造のベンチマークである MolRecBench-Wild を構築する。
- 参考スコア(独自算出の注目度): 38.137828836708806
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optical Chemical Structure Recognition (OCSR) aims to translate molecular diagrams in scientific literature into machine-readable formats, but current systems remain unreliable on real-world images due to substantial visual and chemical complexity. We introduce MOSAIC, a dual-dimensional difficulty framework with 37 fine-grained labels that jointly characterize visual interference and chemical semantic challenges in molecular diagrams. Based on this framework, we construct MolRecBench-Wild, a benchmark of 5,029 structures from 820 recent chemistry papers, covering the full difficulty spectrum observed in real publications. To enable faithful semantic evaluation beyond SMILES and MolFile, we propose CARBON, a representation language capable of expressing valence variations, icon-based groups, and other non-standard chemical semantics. We further adopt a dual-track evaluation protocol supporting both CARBON and SMILES outputs for broad model compatibility. Comprehensive experiments over 18 OCSR-capable models reveal severe performance degradation on MolRecBench-Wild, exposing a large gap between previous patent benchmarks and real-world academic scenarios.
- Abstract(参考訳): 光学化学構造認識(OCSR)は、科学文献の分子図を機械可読形式に変換することを目的としているが、現在のシステムは、相当な視覚的・化学的複雑さのため、現実世界の画像では信頼性が低いままである。
分子図の視覚的干渉と化学的意味論を共同で特徴付ける,37個の細粒度ラベルを持つ2次元難易度フレームワークMOSAICを紹介する。
この枠組みに基づき、820の最近の化学論文から5,029構造のベンチマークである MolRecBench-Wild を構築する。
SMILES や MolFile を超えて忠実なセマンティック評価を可能にするため,数式変化やアイコンに基づくグループ,その他の非標準化学意味論を表現可能な表現言語である CARBON を提案する。
さらに,CarRBON と SMILES の両出力をサポートする2トラック評価プロトコルを採用し,より広いモデル互換性を実現する。
18個のOCSR対応モデルに対する総合的な実験により、MolRecBench-Wildの性能劣化が明らかになり、以前の特許ベンチマークと実世界の学術シナリオの間に大きなギャップが生じた。
関連論文リスト
- COMO: Closed-Loop Optical Molecule Recognition with Minimum Risk Training [0.0]
光化学構造認識(OCSR)に最小リスクトレーニングを導入する
COMOは、分子レベルの非微分可能な目的を直接最適化することで、露光バイアスを緩和するクローズドループフレームワークである。
合成および実世界の化学図を含む10のベンチマーク実験では、COMOが既存のルールベースおよび学習ベースの手法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2026-04-26T05:48:21Z) - MolSight: Optical Chemical Structure Recognition with SMILES Pretraining, Multi-Granularity Learning and Reinforcement Learning [47.029225594084345]
MolSightは総合的な学習フレームワークで、3段階のトレーニングパラダイムを採用している。
我々は,MollSightが(ステレオ)化学光学構造認識における最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-11-21T15:11:47Z) - Benchmarking Multimodal LLMs on Recognition and Understanding over Chemical Tables [48.39080455781475]
ChemTable(チェムタブル、英: ChemTable)は、実験的な論文から得られた実世界の化学表の大規模なベンチマークである。
ChemTableには、専門家によるアノテートされたセルポリゴン、論理レイアウト、試薬、触媒、収率、グラフィカルコンポーネントを含むドメイン固有のラベルが含まれている。
我々は、ChemTable上で、オープンソースモデルとクローズドソースモデルの両方を含む様々な代表的マルチモーダルモデルを評価し、実践的および概念的洞察を伴う一連の知見を報告した。
論文 参考訳(メタデータ) (2025-06-13T00:45:41Z) - GTR-CoT: Graph Traversal as Visual Chain of Thought for Molecular Structure Recognition [60.76623665324548]
GTR-Mol-VLMは、2つの重要な革新を特徴とする新しいフレームワークである。
シーケンシャルな原子結合予測を通じて分子グラフを段階的に解析することで、人間の推論をエミュレートする。
MolRec-BenchはOCSRにおけるグラフパーシング精度の詳細な評価のために設計された最初のベンチマークである。
論文 参考訳(メタデータ) (2025-06-09T08:47:10Z) - MolMole: Molecule Mining from Scientific Literature [10.183226397580876]
MolMoleは、分子検出、反応図解析、光学化学構造認識を統合するビジョンベースのディープラーニングフレームワークである。
分子境界ボックス,反応ラベル,MOLファイルを付加した550ページのテストセットを提示する。
MolMoleはベンチマークと公開データセットの両方で既存のツールキットよりも優れています。
論文 参考訳(メタデータ) (2025-04-30T09:30:04Z) - OCSU: Optical Chemical Structure Understanding for Molecule-centric Scientific Discovery [4.905515668299634]
光化学構造理解(OCSU)タスクは、化学構造図を機械と化学の双方で読みやすい文字列に変換することを目的としている。
局所無明な原子に対する注意的特徴強調によるOCSR性能向上のためのDoubleCheckを提案する。
また,最初の大規模OCSUデータセットであるVis-Chebi20を構築した。
論文 参考訳(メタデータ) (2025-01-26T06:14:29Z) - Building Open Knowledge Graph for Metal-Organic Frameworks (MOF-KG):
Challenges and Case Studies [63.61566811532431]
金属有機フレームワーク(MOF)は、ガス貯蔵、分子分離、化学センシング、結晶および薬物のデリバリーといった応用に革命をもたらす大きな可能性を持っている。
ケンブリッジ構造データベース(CSD)は10,636個のMOF結晶を報告しており、これには114,373個のMOF構造が含まれる。
本稿では,MOF予測,発見,合成を容易にする知識グラフ手法の活用に向けた取り組みについて述べる。
論文 参考訳(メタデータ) (2022-07-10T16:41:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。