論文の概要: UniSite: The First Cross-Structure Dataset and Learning Framework for End-to-End Ligand Binding Site Detection
- arxiv url: http://arxiv.org/abs/2506.03237v1
- Date: Tue, 03 Jun 2025 17:49:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:13.976049
- Title: UniSite: The First Cross-Structure Dataset and Learning Framework for End-to-End Ligand Binding Site Detection
- Title(参考訳): UniSite: エンド・ツー・エンドのリガンド結合サイト検出のための最初のクロスストラクチャデータセットと学習フレームワーク
- Authors: Jigang Fan, Quanlin Wu, Shengjie Luo, Liwei Wang,
- Abstract要約: 提案するUniSiteは,設定した予測損失とマッチングによって教師される最初のエンドツーエンドのリガンド結合サイト検出フレームワークである。
また, 平均精度を, リガンド結合サイト予測のためのより正確な評価指標として導入する。
データセットとコードはhttps://github.com/quanlin-wu/unisite.comで公開される。
- 参考スコア(独自算出の注目度): 14.61824761686053
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The detection of ligand binding sites for proteins is a fundamental step in Structure-Based Drug Design. Despite notable advances in recent years, existing methods, datasets, and evaluation metrics are confronted with several key challenges: (1) current datasets and methods are centered on individual protein-ligand complexes and neglect that diverse binding sites may exist across multiple complexes of the same protein, introducing significant statistical bias; (2) ligand binding site detection is typically modeled as a discontinuous workflow, employing binary segmentation and subsequent clustering algorithms; (3) traditional evaluation metrics do not adequately reflect the actual performance of different binding site prediction methods. To address these issues, we first introduce UniSite-DS, the first UniProt (Unique Protein)-centric ligand binding site dataset, which contains 4.81 times more multi-site data and 2.08 times more overall data compared to the previously most widely used datasets. We then propose UniSite, the first end-to-end ligand binding site detection framework supervised by set prediction loss with bijective matching. In addition, we introduce Average Precision based on Intersection over Union (IoU) as a more accurate evaluation metric for ligand binding site prediction. Extensive experiments on UniSite-DS and several representative benchmark datasets demonstrate that IoU-based Average Precision provides a more accurate reflection of prediction quality, and that UniSite outperforms current state-of-the-art methods in ligand binding site detection. The dataset and codes will be made publicly available at https://github.com/quanlin-wu/unisite.
- Abstract(参考訳): タンパク質のリガンド結合部位の検出は、構造に基づく医薬品設計の基本的なステップである。
近年の顕著な進歩にもかかわらず、既存の手法、データセット、評価指標はいくつかの重要な課題に直面している。(1) 現在のデータセットと手法は個々のタンパク質-リガンド複合体に集中しており、様々な結合部位が同じタンパク質の複数の複合体にまたがって存在していることを無視する;(2)リガンド結合部位の検出は、通常、バイナリセグメンテーションとその後のクラスタリングアルゴリズムを用いて不連続なワークフローとしてモデル化される;(3) 従来の評価指標は、異なる結合部位予測手法の実際の性能を適切に反映していない。
これらの問題に対処するために、最初にUniProt(Unique Protein)中心のリガンド結合サイトデータセットであるUniSite-DSを紹介した。
提案するUniSiteは,ビジェクティブマッチングによる予測損失を制御した最初のエンド・ツー・エンドのリガンド結合サイト検出フレームワークである。
さらに、IoU(Intersection over Union)に基づく平均精度を、リガンド結合サイト予測のためのより正確な評価基準として導入する。
UniSite-DSといくつかの代表的なベンチマークデータセットに関する大規模な実験は、IoUベースの平均精度が予測品質をより正確に反映し、UniSiteがリガンド結合サイト検出における現在の最先端手法より優れていることを示した。
データセットとコードはhttps://github.com/quanlin-wu/unisite.comで公開される。
関連論文リスト
- A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - Cross-Dataset Gaze Estimation by Evidential Inter-intra Fusion [38.93368421481945]
クロスデータセットモデルをトレーニングするための新しいEvidential Inter-Intra Fusion EIFフレームワークを提案する。
さまざまなデータセットに対して独立した単一データセットのブランチを構築します。
さらに、単一データセットのブランチから一般化可能な機能を統合するために、クロスデータセットのブランチを作成します。
論文 参考訳(メタデータ) (2024-09-07T08:53:17Z) - Revisiting Link Prediction: A Data Perspective [59.296773787387224]
グラフの基本的なタスクであるリンク予測は、友人の推薦、タンパク質分析、薬物相互作用予測など、様々な応用において不可欠であることが証明されている。
既存の文献の証拠は、すべてのデータセットに適した普遍的に最良のアルゴリズムが存在しないことを裏付けている。
我々は,局所的な構造的近接,大域的な構造的近接,特徴的近接という,リンク予測に不可欠な3つの基本的要因を認識する。
論文 参考訳(メタデータ) (2023-10-01T21:09:59Z) - Exogenous Data in Forecasting: FARM -- A New Measure for Relevance
Evaluation [62.997667081978825]
FARM - Forward Relevance Aligned Metricという新しいアプローチを導入する。
我々のフォワード法は、その後のデータポイントの変化を時系列に合わせるために比較する角測度に依存する。
第1の検証ステップとして、FARMアプローチの合成信号・代表信号への適用について述べる。
論文 参考訳(メタデータ) (2023-04-21T15:22:33Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。