論文の概要: A Systematic Survey and Benchmark of Deep Learning for Molecular Property Prediction in the Foundation Model Era
- arxiv url: http://arxiv.org/abs/2604.16586v1
- Date: Fri, 17 Apr 2026 15:16:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.092715
- Title: A Systematic Survey and Benchmark of Deep Learning for Molecular Property Prediction in the Foundation Model Era
- Title(参考訳): 基礎モデル時代における分子特性予測のためのディープラーニングの体系的調査とベンチマーク
- Authors: Zongru Li, Xingsheng Chen, Honggang Wen, Regina Qianru Zhang, Ming Li, Xiaojin Zhang, Hongzhi Yin, Qiang Yang, Kwok-Yan Lam, Pietro Lio, Siu-Ming Yiu,
- Abstract要約: 分子特性予測は、量子化学、化学情報学、深層学習を統合し、分子構造と生物学的挙動を結びつける。
この調査は、Quantum、Descriptor Machine Learning、Geometric Deep Learning、Foundation Modelsの4つの補完パラダイムをトレースする。
ベンチマーク分析は、広く使われているデータセットと業界的な視点を反映したデータセットの両方からエビデンスを統合する。
- 参考スコア(独自算出の注目度): 57.5440098776759
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular property prediction integrates quantum chemistry, cheminformatics, and deep learning to connect molecular structure with physicochemical and biological behavior. This survey traces four complementary paradigms, including Quantum, Descriptor Machine Learning, Geometric Deep Learning, and Foundation Models, and outlines a unified taxonomy linking molecular representations, model architectures, and interdisciplinary applications. Benchmark analyses integrate evidence from both widely used datasets and datasets reflecting industry perspectives, encompassing quantum, physicochemical, physiological, and biophysical domains. The survey examines current standards in data curation, splitting strategies, and evaluation protocols, highlighting challenges including inconsistent stereochemistry, heterogeneous assay sources, and reproducibility limitations under random or poorly defined splits. These observations motivate the modernization of benchmark design toward more transparent, time- and scaffold-aware methodologies. We further propose three forward-looking directions: (i) physics-aware learning embedding quantum consistency, (ii) uncertainty-calibrated foundation models for trustworthy inference, and (iii) realistic multimodal benchmark ecosystems integrating computational and experimental data. Repository: https://github.com/Zongru-Li/Survey-and-Benchmarks-of-DL-for-Molecular-Property-Prediction-in-the-Fo undation-Model-Era.
- Abstract(参考訳): 分子特性予測は量子化学、化学情報学、深層学習を統合し、分子構造と物理化学的・生物学的挙動を結びつける。
この調査は、Quantum、Descriptor Machine Learning、Geometric Deep Learning、Foundation Modelsを含む4つの相補的なパラダイムをトレースし、分子表現、モデルアーキテクチャ、学際的アプリケーションを組み合わせた統一された分類法の概要を示した。
ベンチマーク分析は、広く使われているデータセットと、量子、物理化学、生理学、生物物理学の領域を含む産業的な視点を反映するデータセットの両方から証拠を統合する。
この調査は、データキュレーション、分割戦略、評価プロトコルの現在の標準を調査し、一貫性のない立体化学、異種アッセイ源、ランダムまたは未定義の分割下での再現性制限などの課題を強調している。
これらの観察は、より透明で時間的、足場を意識した手法へのベンチマーク設計の近代化を動機付けている。
さらに前向きな3つの方向を提案する。
(i)量子一貫性を組み込んだ物理学習
二 信頼に値する推論のための不確実性校正基礎モデル、及び
3) 計算データと実験データを統合する現実的なマルチモーダル・ベンチマーク・エコシステム。
Repository: https://github.com/Zongru-Li/Survey-and-Benchmarks-of-DL-for-Molecular-Property-Prediction-in-the-Fo undation-Model-Era
関連論文リスト
- Learning Hidden Structures in Open Quantum Dynamics [78.4675086615913]
本研究では,制限された実験アクセス下でのオープン量子力学の隠れ構造的特徴を識別するための機械学習手法を提案する。
我々のフレームワークは、有効マルコフ進化の根底にある不変代数構造の推定を目標としている。
このアプローチの実現性は、複数の合成モデルと導波路量子電磁力学系で説明される。
論文 参考訳(メタデータ) (2026-04-01T10:20:38Z) - FlexMS is a flexible framework for benchmarking deep learning-based mass spectrum prediction tools in metabolomics [22.314786276794717]
化学分子の同定と性質予測は、薬物発見と物質科学の発展において重要な役割を担っている。
深層学習モデルは分子構造スペクトルを予測できるが、全体的な評価は難しい。
我々の貢献は、質量スペクトル予測における多様なモデルアーキテクチャの構築と評価のためのベンチマークフレームワークFlexMSの作成である。
論文 参考訳(メタデータ) (2026-02-26T10:05:01Z) - Learning Biomolecular Motion: The Physics-Informed Machine Learning Paradigm [0.0]
物理インフォームド機械学習は、データ駆動推論と物理的な制約を統合する体系的なフレームワークを提供する。
我々はこれらのアプローチを「生体分子閉鎖問題」の解として捉えている。
我々は、機械学習、統計物理学、計算化学の交差点における先進的な研究の道について概説する。
論文 参考訳(メタデータ) (2025-11-10T00:24:06Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - Deep Learning in Astrophysics [0.2700171473617699]
深層学習は天文学の様々な視点を生み出し、このレビューを動機づける支持者と懐疑主義者の間で議論が続いている。
ニューラルネットワークが古典的な統計を補完し、現代のサーベイのためのデータ分析ツールキットを拡張する方法について検討する。
このレビューでは、ディープラーニングがアーキテクチャ設計を通じてドメイン知識をどのように組み入れているかを示す。
論文 参考訳(メタデータ) (2025-10-12T17:31:46Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。