論文の概要: DiSE: A diffusion probabilistic model for automatic structure elucidation of organic compounds
- arxiv url: http://arxiv.org/abs/2510.26231v1
- Date: Thu, 30 Oct 2025 08:10:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.70546
- Title: DiSE: A diffusion probabilistic model for automatic structure elucidation of organic compounds
- Title(参考訳): DiSE: 有機化合物の自動構造解明のための拡散確率モデル
- Authors: Haochen Chen, Qi Huang, Anan Wu, Wenhao Zhang, Jianliang Ye, Jianming Wu, Kai Tan, Xin Lu, Xin Xu,
- Abstract要約: DiSEは、複数の分光モダリティを統合する、エンドツーエンドの拡散に基づく生成モデルである。
それは、計算されたスペクトルで訓練されているにもかかわらず、優れた精度、化学的に多様なデータセットをまたいだ強力な一般化、実験データに対する堅牢性を達成する。
- 参考スコア(独自算出の注目度): 17.43184484460819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic structure elucidation is essential for self-driving laboratories as it enables the system to achieve truly autonomous. This capability closes the experimental feedback loop, ensuring that machine learning models receive reliable structure information for real-time decision-making and optimization. Herein, we present DiSE, an end-to-end diffusion-based generative model that integrates multiple spectroscopic modalities, including MS, 13C and 1H chemical shifts, HSQC, and COSY, to achieve automated yet accurate structure elucidation of organic compounds. By learning inherent correlations among spectra through data-driven approaches, DiSE achieves superior accuracy, strong generalization across chemically diverse datasets, and robustness to experimental data despite being trained on calculated spectra. DiSE thus represents a significant advance toward fully automated structure elucidation, with broad potential in natural product research, drug discovery, and self-driving laboratories.
- Abstract(参考訳): システムが真に自律的な達成を可能にするため、自動構造解明は自動運転研究所にとって不可欠である。
この機能は実験的なフィードバックループを閉じ、機械学習モデルがリアルタイムな意思決定と最適化のために信頼できる構造情報を受け取ることを保証する。
本稿では,MS,13C,1Hの化学シフト,HSQC,COSYを含む多成分の分光特性を統合し,有機化合物の自動的かつ正確な構造決定を実現するための,エンドツーエンド拡散モデルであるDiSEを提案する。
データ駆動アプローチを通じてスペクトル間の固有相関を学習することにより、DiSEはより優れた精度、化学的に多様なデータセットをまたいだ強力な一般化、そして計算されたスペクトルで訓練されたにもかかわらず実験データに対する堅牢性を達成する。
したがって、DiSEは、完全に自動化された構造解明への大きな進歩であり、天然物の研究、薬物発見、自動運転研究所に幅広い可能性を秘めている。
関連論文リスト
- AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation [0.10999592665107412]
AutoLabsは、自然言語命令を自動で実行可能なプロトコルに変換するように設計された、自己修正型マルチエージェントアーキテクチャである。
複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。
以上の結果から,エージェント推論能力が成功の最も重要な要因であることが示唆された。
論文 参考訳(メタデータ) (2025-09-30T01:51:46Z) - Interpretable Spectral Features Predict Conductivity in Self-Driving Doped Conjugated Polymer Labs [2.8914750842461583]
自動運転ラボは、自動化と機械学習を結合することで、より高速な材料発見を約束する。
我々は光分光法から解釈可能な分光指紋を学習し、電気伝導率を予測することでこの問題に対処する。
論文 参考訳(メタデータ) (2025-09-06T18:00:40Z) - A Neural Network Approach to Multi-radionuclide TDCR Beta Spectroscopy [12.470638217209851]
トリプル・ツー・ダブル・一致比(TDCR)分光法は、放射性核種定量の標準手法として広く採用されている。
本稿では,数値スペクトルシミュレーションとディープラーニングを組み合わせて,標準自由自動解析を行う人工知能フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-03T08:40:02Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - A Transformer Based Generative Chemical Language AI Model for Structural Elucidation of Organic Compounds [1.5628118690186594]
本稿では,概念変換器を用いた生成化学言語人工知能(AI)モデルを提案する。
我々のモデルはエンコーダ・デコーダアーキテクチャと自己保持機構を用いて、最も可能性の高い化学構造を直接生成する。
現代のCPUでは、29個の原子を持つ分子をわずか数秒で構造解明し、83%の精度でトップ15を達成している。
論文 参考訳(メタデータ) (2024-10-13T15:41:20Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。