論文の概要: Synthesizability Prediction of Crystalline Structures with a Hierarchical Transformer and Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2510.19251v1
- Date: Wed, 22 Oct 2025 05:11:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:15.135204
- Title: Synthesizability Prediction of Crystalline Structures with a Hierarchical Transformer and Uncertainty Quantification
- Title(参考訳): 階層型変圧器と不確かさ量子化を用いた結晶構造の合成可能性予測
- Authors: Danial Ebrahimzadeh, Sarah Sharif, Yaser Mike Banad,
- Abstract要約: SyntheFormerは、結晶構造から直接合成性を学ぶ、正の未標識のフレームワークである。
構造認識表現と不確実性認識決定規則を整合させることで、SyntheFormerは、ターゲットを優先順位付けし、最も有望な新しい無機材料に研究室の努力を集中させる実践的な方法を提供する。
- 参考スコア(独自算出の注目度): 0.3823356975862005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting which hypothetical inorganic crystals can be experimentally realized remains a central challenge in accelerating materials discovery. SyntheFormer is a positive-unlabeled framework that learns synthesizability directly from crystal structure, combining a Fourier-transformed crystal periodicity (FTCP) representation with hierarchical feature extraction, Random-Forest feature selection, and a compact deep MLP classifier. The model is trained on historical data from 2011 through 2018 and evaluated prospectively on future years from 2019 to 2025, where the positive class constitutes only 1.02 per cent of samples. Under this temporally separated evaluation, SyntheFormer achieves a test area under the ROC curve of 0.735 and, with dual-threshold calibration, attains high-recall screening with 97.6 per cent recall at 94.2 per cent coverage, which minimizes missed opportunities while preserving discriminative power. Crucially, the model recovers experimentally confirmed metastable compounds that lie far from the convex hull and simultaneously assigns low scores to many thermodynamically stable yet unsynthesized candidates, demonstrating that stability alone is insufficient to predict experimental attainability. By aligning structure-aware representation with uncertainty-aware decision rules, SyntheFormer provides a practical route to prioritize synthesis targets and focus laboratory effort on the most promising new inorganic materials.
- Abstract(参考訳): どの仮説的な無機結晶を実験的に実現できるかを予測することは、物質の発見を加速する上で重要な課題である。
SyntheFormerは、結晶構造から直接合成性を学ぶ正の非ラベルフレームワークであり、フーリエ変換結晶周期性(FTCP)表現と階層的特徴抽出、ランダムフォレスト特徴選択、コンパクトな深層MLP分類器を組み合わせたものである。
このモデルは2011年から2018年までの歴史的データに基づいてトレーニングされ、2019年から2025年までの将来の年数で予測される。
この時間的に分離された評価の下で、SyntheFormerはROC曲線の0.735でテスト領域を達成し、二重閾値校正により97.6%のリコールと94.2%のカバレッジでハイリコールを達成し、識別力を維持しながら欠落する機会を最小限に抑える。
重要なことに、このモデルは、凸殻から遠く離れた場所で実験的に確認された準安定化合物を回収し、同時に低いスコアを多くの熱力学的に安定だが合成されていない候補に割り当て、安定性のみが実験的な到達可能性を予測するには不十分であることを示した。
構造認識表現と不確実性認識決定規則を整合させることで、SyntheFormerは、合成ターゲットを優先順位付けし、最も有望な新しい無機材料に集中する実用的な方法を提供する。
関連論文リスト
- Continuous Uniqueness and Novelty Metrics for Generative Modeling of Inorganic Crystals [10.944242352670708]
生産的な人工知能モデルが開発され、機能性物質の大きな化学空間を効率的にサンプリングすることができる。
これらは典型的には、選択された結晶距離関数に依存する特異性と新規性メトリクスを用いて評価される。
本稿では,これらの制約を理論的に克服する特異性と新規性を評価するために2つの連続距離関数を提案する。
論文 参考訳(メタデータ) (2025-10-14T11:38:21Z) - Beyond Memorization: Reasoning-Driven Synthesis as a Mitigation Strategy Against Benchmark Contamination [77.69093448529455]
本稿では,arXiv論文から直接研究レベルのQAを合成するために,無限にスケーラブルなフレームワークを用いて実証的研究を行う。
各種サイズ,開発者,リリース日といったモデルについて,知識カットオフ日に近い性能劣化の欠如を評価した。
合成パイプラインで要求される多段階の推論は、浅い記憶よりも深い複雑さをもたらしたと仮定する。
論文 参考訳(メタデータ) (2025-08-26T16:41:37Z) - Fitness aligned structural modeling enables scalable virtual screening with AuroBind [56.720030595081845]
AuroBindは、100万規模のケモゲノミクスデータ上に、カスタム原子レベルの構造モデルを微調整するスケーラブルな仮想スクリーニングフレームワークである。
AuroBindは、直接選好最適化、高信頼錯体からの自己蒸留、教師-学生加速戦略を統合している。
AuroBindは10の疾患関連目標に対して、実験的なヒット率7-69%を達成し、トップ化合物はナノモラール下からピコモラールに到達した。
論文 参考訳(メタデータ) (2025-08-04T07:34:48Z) - RETRO SYNFLOW: Discrete Flow Matching for Accurate and Diverse Single-Step Retrosynthesis [23.422202032748924]
単段階逆合成計画をモデル化し、離散フローマッチングフレームワークRETRO SynFLOW(RSF)を導入する。
我々は、シークエンシャルモンテカルロをベースとしたFeynman-Kacステアリングを用いて、推論時に有望な世代をステアリングする。
論文 参考訳(メタデータ) (2025-06-04T20:46:05Z) - Bridging Theory and Experiment in Materials Discovery: Machine-Learning-Assisted Prediction of Synthesizable Structures [4.447856707178621]
本稿では、対称性誘導構造導出とWyckoffエンコードに基づく機械学習モデルを統合する合成可能性駆動型CSPフレームワークを提案する。
このフレームワークは、実験的に知られている13のXSe(X = Sc, Ti, Fe, Ni, Cu)構造を再現し、合成可能な構造を予測する効果を示した。
論文 参考訳(メタデータ) (2025-05-14T05:48:55Z) - Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Probabilistic Phase Labeling and Lattice Refinement for Autonomous
Material Research [20.78180998995325]
確率的XRD位相ラベリングのための効率的なアルゴリズムであるCrystalShiftを提案する。
我々は、CrystalShiftが頑健な確率を提供し、合成および実験データセットにおける既存の手法より優れていることを実証した。
効率的な位相マッピングに加えて、CrystalShiftは材料の構造パラメータに関する定量的な洞察を提供する。
論文 参考訳(メタデータ) (2023-08-15T17:38:38Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。