論文の概要: Molecular Fingerprints Are Strong Models for Peptide Function Prediction
- arxiv url: http://arxiv.org/abs/2501.17901v2
- Date: Tue, 21 Oct 2025 12:41:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:03.415271
- Title: Molecular Fingerprints Are Strong Models for Peptide Function Prediction
- Title(参考訳): 分子指紋はペプチド関数予測のための強いモデルである
- Authors: Jakub Adamczyk, Piotr Ludynia, Wojciech Czech,
- Abstract要約: 長距離分子相互作用はしばしば、複雑なグラフニューラルネットワークと事前訓練されたトランスフォーマーのモデリングを必要とすると仮定される。
単純でドメイン特異的な分子指紋がこれらの仮定なしでペプチド機能を捉えることができるかどうかを検討する。
本研究は, 分子指紋をペプチド予測のための効率的, 解釈可能, 計算的に軽量な代替手段として強調し, 長距離相互作用モデルの必要性を推察するものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding peptide properties is often assumed to require modeling long-range molecular interactions, motivating the use of complex graph neural networks and pretrained transformers. Yet, whether such long-range dependencies are essential remains unclear. We investigate if simple, domain-specific molecular fingerprints can capture peptide function without these assumptions. Atomic-level representation aims to provide richer information than purely sequence-based models and better efficiency than structural ones. Across 132 datasets, including LRGB and five other peptide benchmarks, models using count-based ECFP, Topological Torsion, and RDKit fingerprints with LightGBM achieve state-of-the-art accuracy. Despite encoding only short-range molecular features, these models outperform GNNs and transformer-based approaches. Control experiments with sequence shuffling and amino acid counts confirm that fingerprints, though inherently local, suffice for robust peptide property prediction. Our results challenge the presumed necessity of long-range interaction modeling and highlight molecular fingerprints as efficient, interpretable, and computationally lightweight alternatives for peptide prediction.
- Abstract(参考訳): ペプチドの性質を理解するには、しばしば、複雑なグラフニューラルネットワークと事前学習されたトランスフォーマーの使用を動機として、長距離分子相互作用をモデル化する必要があると仮定される。
しかし、このような長距離依存が必須かどうかはまだ不明である。
単純でドメイン特異的な分子指紋がこれらの仮定なしでペプチド機能を捉えることができるかどうかを検討する。
原子レベルの表現は、純粋にシーケンスベースのモデルよりもリッチな情報を提供し、構造的なモデルよりも優れた効率を提供することを目的としています。
LRGBや他の5つのペプチドベンチマークを含む132のデータセット、カウントベースのECFP、トポロジカルトーション、およびLightGBMによるRDKit指紋を用いたモデルは、最先端の精度を達成する。
短い範囲の分子の特徴のみを符号化するにもかかわらず、これらのモデルはGNNやトランスフォーマーベースのアプローチより優れている。
配列シャッフルとアミノ酸数による制御実験により、指紋は本質的に局所的ではあるが、堅牢なペプチド特性の予測に十分であることが確認された。
本研究は, 分子指紋をペプチド予測のための効率的, 解釈可能, 計算的に軽量な代替手段として強調し, 長距離相互作用モデルの必要性を推察するものである。
関連論文リスト
- Molecular Machine Learning Using Euler Characteristic Transforms [12.108680020079925]
分子の形状は、その物理化学的および生物学的性質を決定する。
幾何学的トポロジカル記述子としてEuler Characteristics Transform (ECT)を提案する。
ECTは、マルチスケールの構造的特徴の抽出を可能にし、特徴空間における分子形状を表現およびエンコードする新しい方法を提供する。
論文 参考訳(メタデータ) (2025-07-04T10:57:40Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - ADMET property prediction through combinations of molecular fingerprints [0.0]
ランダムフォレスト(ランダムフォレスト)またはサポートベクターマシン(サポートベクターマシン)は、最近開発された手法より一貫して優れている。
回帰アルゴリズムと分子指紋の詳細な研究により、勾配型決定木が明らかになった。
私たちは22のTherapeutics Data Commons ADMETベンチマークでモデルを検証しました。
論文 参考訳(メタデータ) (2023-09-29T22:39:18Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - FP-GNN: a versatile deep learning architecture for enhanced molecular
property prediction [3.9838024725595167]
FP-GNNは、分子グラフと指紋から情報を合成し、同時に学習する新しいディープラーニングアーキテクチャである。
乳房細胞株に対する13の公開データセット,非バイアスLIT-PCBAデータセット,14の表現型スクリーニングデータセットについて実験を行った。
FP-GNNアルゴリズムはこれらのデータセット上で最先端の性能を達成した。
論文 参考訳(メタデータ) (2022-05-08T10:36:12Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z) - A Systematic Comparison Study on Hyperparameter Optimisation of Graph
Neural Networks for Molecular Property Prediction [8.02401104726362]
グラフニューラルネットワーク(GNN)は、幅広いグラフ関連学習タスクに対して提案されている。
近年,分子特性の予測に応用されたGNNシステムが増えてきている。
論文 参考訳(メタデータ) (2021-02-08T15:40:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。