論文の概要: SHA-256 Infused Embedding-Driven Generative Modeling of High-Energy Molecules in Low-Data Regimes
- arxiv url: http://arxiv.org/abs/2510.25788v1
- Date: Tue, 28 Oct 2025 18:48:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.486228
- Title: SHA-256 Infused Embedding-Driven Generative Modeling of High-Energy Molecules in Low-Data Regimes
- Title(参考訳): SHA-256 注入埋め込み駆動型高エネルギー分子生成モデリング(SHA-256)
- Authors: Siddharth Verma, Alankar Alankar,
- Abstract要約: 本研究は,分子生成のためのLong Short-Term Memory(LSTM)ネットワークと特性予測のためのAttentive Graph Neural Networks(GNN)を組み合わせることで,高エネルギー分子に対する新しいアプローチを提案する。
爆発速度は9km/s以上と推定された。
- 参考スコア(独自算出の注目度): 1.3518465233957058
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: High-energy materials (HEMs) are critical for propulsion and defense domains, yet their discovery remains constrained by experimental data and restricted access to testing facilities. This work presents a novel approach toward high-energy molecules by combining Long Short-Term Memory (LSTM) networks for molecular generation and Attentive Graph Neural Networks (GNN) for property predictions. We propose a transformative embedding space construction strategy that integrates fixed SHA-256 embeddings with partially trainable representations. Unlike conventional regularization techniques, this changes the representational basis itself, reshaping the molecular input space before learning begins. Without recourse to pretraining, the generator achieves 67.5% validity and 37.5% novelty. The generated library exhibits a mean Tanimoto coefficient of 0.214 relative to training set signifying the ability of framework to generate a diverse chemical space. We identified 37 new super explosives higher than 9 km/s predicted detonation velocity.
- Abstract(参考訳): 高エネルギー材料(HEMs)は、推進と防衛の領域において重要であるが、その発見は実験データと試験施設へのアクセス制限によって制限されている。
本研究は,分子生成のためのLong Short-Term Memory(LSTM)ネットワークと特性予測のためのAttentive Graph Neural Networks(GNN)を組み合わせることで,高エネルギー分子に対する新しいアプローチを提案する。
固定SHA-256埋め込みを部分的に訓練可能な表現と統合した変換型埋め込み空間構築戦略を提案する。
従来の正規化手法とは異なり、これは表現基底自体を変え、学習が始まる前に分子入力空間を再構成する。
事前訓練を行わず、67.5%の妥当性と37.5%の新規性を達成している。
生成したライブラリは,多様な化学空間を生成するためのフレームワークの能力を示すトレーニングセットに対して,平均谷本係数が0.214であることを示す。
爆発速度は9km/s以上と推定された。
関連論文リスト
- Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Hyperactive Learning (HAL) for Data-Driven Interatomic Potentials [0.0]
本研究は,データベース生成の訓練タスクに特化して,高速化サンプリングアルゴリズムを定式化するためのフレームワークであるハイパーアクティブラーニング(HAL)を提案する。
包括的な考え方は、物理的に動機づけられたサンプル(例えば分子動力学)と、システムを高い不確実性へと導くバイアス項から始めることである。
合金の場合、AlSi10の高速(100マイクロ秒/原子/cpuコア)ACE電位が生成され、融解温度を精度良く予測できる。
高分子の場合、長鎖ポリエチレングリコール(PEG)ポリマーの密度を決定できるACEを用いてHALデータベースを構築する。
論文 参考訳(メタデータ) (2022-10-09T11:05:53Z) - Efficient Chemical Space Exploration Using Active Learning Based on
Marginalized Graph Kernel: an Application for Predicting the Thermodynamic
Properties of Alkanes with Molecular Simulation [10.339394156446982]
分子動力学シミュレーションを用いてデータとグラフニューラルネットワーク(GNN)を生成して予測する。
具体的には、4から19個の炭素原子からなる251,728個のアルカン分子とその液体物性を標的としている。
検証の結果、313個の分子だけが正確なGNNモデルを訓練するのに十分であり、計算テストセットは$rm R2 > 0.99$、実験テストセットは$rm R2 > 0.94$であった。
論文 参考訳(メタデータ) (2022-09-01T14:59:13Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Physics Guided Generative Adversarial Networks for Generations of
Crystal Materials with Symmetry Constraints [9.755053639966185]
新たな材料生成のための物理ガイド結晶生成モデル(PGCGM)を提案する。
物質の塩基性原子サイトを増大させることで、20個の空間群からなる新しい物質を生成できる。
本手法により, 発電機の有効性は, ベースラインの8倍に向上する。
論文 参考訳(メタデータ) (2022-03-27T17:21:36Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Generate Novel Molecules With Target Properties Using Conditional
Generative Models [0.0]
トレーニングセット内の分子と同様の小さな分子を生成する新しいニューラルネットワークを提案する。
我々のネットワークは,分子量,ログP,薬物類似度の定量的評価を指標として,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-09-15T18:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。