論文の概要: Hyper-Dimensional Fingerprints as Molecular Representations
- arxiv url: http://arxiv.org/abs/2604.27810v1
- Date: Thu, 30 Apr 2026 12:53:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.0932
- Title: Hyper-Dimensional Fingerprints as Molecular Representations
- Title(参考訳): 分子表現としての超次元フィンガープリント
- Authors: Jonas Teufel, Luca Torresi, André Eberhard, Pascal Friederich,
- Abstract要約: 超次元指紋は、高次元ベクトル上での操作でメッセージ通過ニューラルネットワークの学習された変換を置き換える。
HDFはタスクの大部分で従来の指紋よりも優れており、データセットやモデル間の一貫性が向上している。
我々は,Morganの指紋がランダム検索と相容れない状況下で,HDFベースのサロゲートモデルが試料効率を大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 2.5082404486343424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational molecular representations underpin virtual screening, property prediction, and materials discovery. Conventional fingerprints are efficient and deterministic but lose structural information through hash-based compression, particularly at low dimensionalities. Learned representations from graph neural networks recover this expressiveness but require task-specific training and substantial computational resources. Here we introduce hyperdimensional fingerprints (HDF), which replace the learned transformations of message-passing neural networks with algebraic operations on high-dimensional vectors, producing deterministic molecular representations without any training. Across diverse property prediction benchmarks, HDF outperforms conventional fingerprints in the majority of tasks while exhibiting greater consistency across datasets and models. Crucially, HDF embeddings preserve molecular similarity faithfully: at 32 dimensions, distances in HDF space achieve a 0.9 Pearson correlation with graph edit distance, compared to 0.55 for Morgan fingerprints at equivalent size. This structural fidelity persists at low dimensions where hash-based methods degrade, allowing simple nearest-neighbor regression to remain predictive with as few as 64 components. We further demonstrate the practical impact in Bayesian molecular optimization, where HDF-based surrogate models achieve substantially improved sample efficiency in regimes where Morgan fingerprints perform comparably to random search. HDF thus provides a general-purpose, training-free alternative to conventional molecular fingerprints, suggesting that the information loss long accepted as inherent to fixed-length fingerprints is a limitation of the hash-based encoding scheme rather than the fingerprint paradigm itself.
- Abstract(参考訳): 計算分子表現は、仮想スクリーニング、プロパティ予測、材料発見の基盤となる。
従来の指紋は効率的で決定論的であるが、ハッシュベースの圧縮、特に低次元で構造情報を失う。
グラフニューラルネットワークから学習した表現は、この表現性を回復するが、タスク固有のトレーニングと相当な計算資源を必要とする。
本稿では,高次元ベクトル上での代数的演算によるメッセージパッシングニューラルネットワークの学習的変換を置き換えた超次元指紋(HDF)を導入し,学習を伴わない決定論的分子表現を生成する。
さまざまなプロパティ予測ベンチマークを通じて、HDFは従来の指紋よりも多くのタスクで優れており、データセットやモデル間の一貫性が向上している。
重要な点として、HDFの埋め込みは分子の類似性を忠実に保存する:32次元では、HDF空間内の距離はグラフ編集距離と0.9ピアソンの相関を達成し、モーガン指紋の等価サイズは0.55である。
この構造的忠実度はハッシュベースのメソッドが劣化する低次元に持続し、単純な近傍回帰は64個のコンポーネントで予測可能である。
さらに,HDFに基づくサロゲートモデルにより,Morganの指紋がランダム検索と相容れない状態において,試料効率を大幅に向上するバイーシアン分子最適化の実践的影響を実証した。
したがって、HDFは従来の分子指紋に代わる汎用的なトレーニング不要な代替手段を提供しており、固定長指紋固有の情報損失は、指紋パラダイム自体よりもハッシュベースの符号化方式の制限であることを示唆している。
関連論文リスト
- Hash Collisions in Molecular Fingerprints: Effects on Property Prediction and Bayesian Optimization [4.157678834755669]
分子フィンガープリント法はハッシュ関数を用いて分子の固定長ベクトル表現を生成する。
ハッシュ衝突は、異なるサブ構造を同じ特徴で表す原因となり、分子類似性計算において過大評価される。
5つの分子特性予測ベンチマークにおいて, 正確な指紋を用いた場合, 精度は小さながら一貫した改善が得られた。
論文 参考訳(メタデータ) (2025-11-21T09:31:42Z) - Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - Fractional Spike Differential Equations Neural Network with Efficient Adjoint Parameters Training [63.3991315762955]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューロンからインスピレーションを得て、脳に似た計算の現実的なモデルを作成する。
既存のほとんどのSNNは、マルコフ特性を持つ一階常微分方程式(ODE)によってモデル化された、神経細胞膜電圧ダイナミクスの単一時間定数を仮定している。
本研究では, 膜電圧およびスパイク列車の長期依存性を分数次力学により捉えるフラクタルSPIKE微分方程式ニューラルネットワーク (fspikeDE) を提案する。
論文 参考訳(メタデータ) (2025-07-22T18:20:56Z) - Molecular Fingerprints Are Strong Models for Peptide Function Prediction [0.0]
長距離分子相互作用はしばしば、複雑なグラフニューラルネットワークと事前訓練されたトランスフォーマーのモデリングを必要とすると仮定される。
単純でドメイン特異的な分子指紋がこれらの仮定なしでペプチド機能を捉えることができるかどうかを検討する。
本研究は, 分子指紋をペプチド予測のための効率的, 解釈可能, 計算的に軽量な代替手段として強調し, 長距離相互作用モデルの必要性を推察するものである。
論文 参考訳(メタデータ) (2025-01-29T10:05:27Z) - Assessing Neural Network Representations During Training Using
Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。
データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。
本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文 参考訳(メタデータ) (2023-12-04T01:32:42Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - ADMET property prediction through combinations of molecular fingerprints [0.0]
ランダムフォレスト(ランダムフォレスト)またはサポートベクターマシン(サポートベクターマシン)は、最近開発された手法より一貫して優れている。
回帰アルゴリズムと分子指紋の詳細な研究により、勾配型決定木が明らかになった。
私たちは22のTherapeutics Data Commons ADMETベンチマークでモデルを検証しました。
論文 参考訳(メタデータ) (2023-09-29T22:39:18Z) - ToDD: Topological Compound Fingerprinting in Computer-Aided Drug
Discovery [8.620443111346523]
コンピュータ支援薬物発見(CADD)において、仮想スクリーニングは、化合物の大きなライブラリーにおいて分子標的に結合する可能性が最も高い薬物候補を特定するために用いられる。
この問題に対処するため,多次元ベクトルとして化合物のトポロジ的指紋を生成する多パラメータ持続性(MP)ホモロジーを用いた新しい手法を開発した。
プレトレーニングトトリプルトネットワークのマージン損失の微調整は, 組込み空間における化合物の相違や, 有効な薬物候補になる可能性のランク付けにおいて, 高い競争力を発揮することを示す。
論文 参考訳(メタデータ) (2022-11-07T19:00:05Z) - ProxyFAUG: Proximity-based Fingerprint Augmentation [81.15016852963676]
ProxyFAUGはルールベースで近接性に基づく指紋増強法である。
このデータセット上で最高のパフォーマンスの測位法は、中央値エラーで40%改善され、平均誤差で6%向上した。
論文 参考訳(メタデータ) (2021-02-04T15:59:30Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。