論文の概要: LengthLogD: A Length-Stratified Ensemble Framework for Enhanced Peptide Lipophilicity Prediction via Multi-Scale Feature Integration
- arxiv url: http://arxiv.org/abs/2505.17198v1
- Date: Thu, 22 May 2025 18:05:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.643423
- Title: LengthLogD: A Length-Stratified Ensemble Framework for Enhanced Peptide Lipophilicity Prediction via Multi-Scale Feature Integration
- Title(参考訳): LengthLogD: マルチスケール機能統合によるペプチドリポフィリティーの増大予測のための長ストストレートアンサンブルフレームワーク
- Authors: Shuang Wu, Meijie Wang, Lun Yu,
- Abstract要約: LengthLogDは、分子長層化によって特殊なモデルを確立する予測フレームワークである。
長鎖ペプチドに特異的に開発された適応重み付け機構はモデル一般化性を著しく向上させる。
本研究は、ペプチド医薬品開発のための正確なログD予測ツールを提供し、特に長鎖ペプチド鉛化合物の最適化におけるユニークな価値を示す。
- 参考スコア(独自算出の注目度): 7.108841574193276
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Peptide compounds demonstrate considerable potential as therapeutic agents due to their high target affinity and low toxicity, yet their drug development is constrained by their low membrane permeability. Molecular weight and peptide length have significant effects on the logD of peptides, which in turn influences their ability to cross biological membranes. However, accurate prediction of peptide logD remains challenging due to the complex interplay between sequence, structure, and ionization states. This study introduces LengthLogD, a predictive framework that establishes specialized models through molecular length stratification while innovatively integrating multi-scale molecular representations. We constructed feature spaces across three hierarchical levels: atomic (10 molecular descriptors), structural (1024-bit Morgan fingerprints), and topological (3 graph-based features including Wiener index), optimized through stratified ensemble learning. An adaptive weight allocation mechanism specifically developed for long peptides significantly enhances model generalizability. Experimental results demonstrate superior performance across all categories: short peptides (R^2=0.855), medium peptides (R^2=0.816), and long peptides (R^2=0.882), with a 34.7% reduction in prediction error for long peptides compared to conventional single-model approaches. Ablation studies confirm: 1) The length-stratified strategy contributes 41.2% to performance improvement; 2) Topological features account for 28.5% of predictive importance. Compared to state-of-the-art models, our method maintains short peptide prediction accuracy while achieving a 25.7% increase in the coefficient of determination (R^2) for long peptides. This research provides a precise logD prediction tool for peptide drug development, particularly demonstrating unique value in optimizing long peptide lead compounds.
- Abstract(参考訳): ペプチド化合物は高い標的親和性と低毒性のために治療薬として有意な潜在性を示すが、その薬物開発は低い膜透過性によって制限される。
分子量とペプチドの長さは、ペプチドの対数Dに大きな影響を与え、生物膜を横断する能力に影響を及ぼす。
しかし、配列、構造、イオン化状態の複雑な相互作用のため、ペプチドlogDの正確な予測は依然として困難である。
本研究は,分子長階層化による特殊モデルの構築と,マルチスケール分子表現の革新的統合を目的とした予測フレームワークであるLengthLogDを紹介する。
階層化学習によって最適化された原子(10分子記述子)、構造(1024ビットモーガン指紋)、トポロジカル(Wiener indexを含む3つのグラフベース特徴)の3つの階層レベルの特徴空間を構築した。
長鎖ペプチドに特異的に開発された適応重み付け機構はモデル一般化性を著しく向上させる。
実験により, 短ペプチド (R^2=0.855), 中ペプチド (R^2=0.816), 長ペプチド (R^2=0.882), 長ペプチド (R^2=0.882), 長ペプチドの予測誤差が34.7%減少した。
アブレーション研究は以下の通りである。
1) 長編戦略は, 性能改善に41.2%貢献する。
2) トポロジカルな特徴は予測的重要性の28.5%を占める。
最先端モデルと比較して, 長ペプチドに対する決定係数(R^2)を25.7%増加させながら, 短いペプチド予測精度を維持した。
本研究は、ペプチド医薬品開発のための正確なログD予測ツールを提供し、特に長鎖ペプチド鉛化合物の最適化におけるユニークな価値を示す。
関連論文リスト
- PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.80441546742053]
系統樹は種間の進化的関係を解明する。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文 参考訳(メタデータ) (2024-12-25T08:33:05Z) - Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension [34.5830296205857]
PepHARは、特定のタンパク質を標的としたペプチドを設計するためのホットスポット駆動の自己回帰生成モデルである。
特定のホットスポット残基が高い相互作用ポテンシャルを持つという観測に基づいて、我々はまずエネルギーベースの密度モデルを用いてこれらのキー残基を適合させ、サンプリングする。
ホットスポットサンプリングとフラグメントベースの拡張を組み合わせることで,ターゲットタンパク質に適合したデノボペプチドの設計が可能となった。
論文 参考訳(メタデータ) (2024-11-26T15:13:17Z) - Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.812284760539713]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。
溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。
本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文 参考訳(メタデータ) (2024-07-02T20:13:47Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - PepLand: a large-scale pre-trained peptide representation model for a
comprehensive landscape of both canonical and non-canonical amino acids [0.4348327622270753]
PepLandは、カノニカルアミノ酸と非カノニカルアミノ酸の両方にまたがるペプチドの表現と性質解析のための新しい事前学習アーキテクチャである。
本質的にPepLandは、ペプチドの微妙な構造表現を明らかにするために、包括的な多視点不均一グラフニューラルネットワークを活用している。
論文 参考訳(メタデータ) (2023-11-08T01:18:32Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。