論文の概要: Molecular Fingerprints Are Strong Models for Peptide Function Prediction
- arxiv url: http://arxiv.org/abs/2501.17901v1
- Date: Wed, 29 Jan 2025 10:05:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-31 15:14:00.181560
- Title: Molecular Fingerprints Are Strong Models for Peptide Function Prediction
- Title(参考訳): 分子指紋はペプチド関数予測のための強いモデルである
- Authors: Jakub Adamczyk, Piotr Ludynia, Wojciech Czech,
- Abstract要約: ペプチド特性予測における分子指紋の有効性について検討した。
分子グラフからドメイン固有の特徴抽出が複雑で計算コストのかかるモデルより優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We study the effectiveness of molecular fingerprints for peptide property prediction and demonstrate that domain-specific feature extraction from molecular graphs can outperform complex and computationally expensive models such as GNNs, pretrained sequence-based transformers and multimodal ensembles, even without hyperparameter tuning. To this end, we perform a thorough evaluation on 126 datasets, achieving state-of-the-art results on LRGB and 5 other peptide function prediction benchmarks. We show that models based on count variants of ECFP, Topological Torsion, and RDKit molecular fingerprints and LightGBM as classification head are remarkably robust. The strong performance of molecular fingerprints, which are intrinsically very short-range feature encoders, challenges the presumed importance of long-range interactions in peptides. Our conclusion is that the use of molecular fingerprints for larger molecules, such as peptides, can be a computationally feasible, low-parameter, and versatile alternative to sophisticated deep learning models.
- Abstract(参考訳): ペプチド特性予測における分子指紋の有効性について検討し,分子グラフからのドメイン特異的特徴抽出が,GNN,事前訓練されたシーケンスベーストランスフォーマー,マルチモーダルアンサンブルなどの複雑で計算コストの高いモデルよりも優れていることを示した。
そこで本研究では,LRGBおよび他の5つのペプチド関数予測ベンチマークを用いて,126個のデータセットの詳細な評価を行った。
ECFP, トポロジカル・トーション, RDKit分子指紋の計数変動に基づくモデルと, 分類ヘッドとしてのLightGBMが極めて堅牢であることを示す。
内在的に非常に短距離の特徴エンコーダである分子指紋の強い性能は、ペプチドにおける長距離相互作用の重要性を疑う。
我々の結論は、ペプチドのような大きな分子に分子指紋を使用することは、高度なディープラーニングモデルに代わる計算可能で、低パラメータで、汎用的な代替物になり得るということだ。
関連論文リスト
- DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - ADMET property prediction through combinations of molecular fingerprints [0.0]
ランダムフォレスト(ランダムフォレスト)またはサポートベクターマシン(サポートベクターマシン)は、最近開発された手法より一貫して優れている。
回帰アルゴリズムと分子指紋の詳細な研究により、勾配型決定木が明らかになった。
私たちは22のTherapeutics Data Commons ADMETベンチマークでモデルを検証しました。
論文 参考訳(メタデータ) (2023-09-29T22:39:18Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - FP-GNN: a versatile deep learning architecture for enhanced molecular
property prediction [3.9838024725595167]
FP-GNNは、分子グラフと指紋から情報を合成し、同時に学習する新しいディープラーニングアーキテクチャである。
乳房細胞株に対する13の公開データセット,非バイアスLIT-PCBAデータセット,14の表現型スクリーニングデータセットについて実験を行った。
FP-GNNアルゴリズムはこれらのデータセット上で最先端の性能を達成した。
論文 参考訳(メタデータ) (2022-05-08T10:36:12Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z) - A Systematic Comparison Study on Hyperparameter Optimisation of Graph
Neural Networks for Molecular Property Prediction [8.02401104726362]
グラフニューラルネットワーク(GNN)は、幅広いグラフ関連学習タスクに対して提案されている。
近年,分子特性の予測に応用されたGNNシステムが増えてきている。
論文 参考訳(メタデータ) (2021-02-08T15:40:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。