論文の概要: CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization
- arxiv url: http://arxiv.org/abs/2603.18571v1
- Date: Thu, 19 Mar 2026 07:33:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.006876
- Title: CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization
- Title(参考訳): CAPSUL: 細胞内局在のための包括的ヒトタンパク質ベンチマーク
- Authors: Yicheng Hu, Xinyu Lin, Shulin Li, Wenjie Wang, Fengbin Zhu, Fuli Feng,
- Abstract要約: 我々は, 多様な3次元構造表現と微細な細胞内局在アノテーションを統合するデータセットである $mathbfCAPSUL$ という新しいベンチマークを導入する。
このベンチマークは、様々な最先端のシーケンスベースモデルと構造ベースモデルを用いて評価し、この課題に構造的特徴を関与させることの重要性を示す。
最後に,Golgi 装置のケーススタディを通じて,構造に基づく手法の強力な解釈可能性を示す。
- 参考スコア(独自算出の注目度): 50.559485139565076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Subcellular localization is a crucial biological task for drug target identification and function annotation. Although it has been biologically realized that subcellular localization is closely associated with protein structure, no existing dataset offers comprehensive 3D structural information with detailed subcellular localization annotations, thus severely hindering the application of promising structure-based models on this task. To address this gap, we introduce a new benchmark called $\mathbf{CAPSUL}$, a $\mathbf{C}$omprehensive hum$\mathbf{A}$n $\mathbf{P}$rotein benchmark for $\mathbf{SU}$bcellular $\mathbf{L}$ocalization. It features a dataset that integrates diverse 3D structural representations with fine-grained subcellular localization annotations carefully curated by domain experts. We evaluate this benchmark using a variety of state-of-the-art sequence-based and structure-based models, showcasing the importance of involving structural features in this task. Furthermore, we explore reweighting and single-label classification strategies to facilitate future investigation on structure-based methods for this task. Lastly, we showcase the powerful interpretability of structure-based methods through a case study on the Golgi apparatus, where we discover a decisive localization pattern $α$-helix from attention mechanisms, demonstrating the potential for bridging the gap with intuitive biological interpretability and paving the way for data-driven discoveries in cell biology.
- Abstract(参考訳): 細胞内局在は、薬物標的の同定と機能アノテーションにとって重要な生物学的課題である。
細胞内局在がタンパク質構造と密接に関連していることは生物学的に認識されているが、既存のデータセットでは詳細な細胞内局在アノテーションを含む包括的3D構造情報を提供しておらず、将来的な構造モデルの適用を著しく妨げている。
このギャップを解決するために、$\mathbf{CAPSUL}$, a $\mathbf{C}$omprehensive hum$\mathbf{A}$n $\mathbf{P}$rotein benchmark for $\mathbf{SU}$bcellular $\mathbf{L}$ocalizationという新しいベンチマークを導入する。
さまざまな3D構造表現と微細な細胞内局在アノテーションを統合するデータセットをドメインの専門家が慎重にキュレートする。
このベンチマークは、様々な最先端のシーケンスベースモデルと構造ベースモデルを用いて評価し、この課題に構造的特徴を関与させることの重要性を示す。
さらに,本課題に対する構造的手法の今後の研究を促進するために,再重み付けとシングルラベル分類戦略について検討する。
最後に,Golgi 装置を用いたケーススタディにより,注意機構から決定的な局所化パターン $α$-helix を発見し,直感的な生物学的解釈可能性とギャップを埋める可能性を示し,細胞生物学におけるデータ駆動的発見の道を開いた。
関連論文リスト
- subCellSAM: Zero-Shot (Sub-)Cellular Segmentation for Hit Validation in Drug Discovery [1.1866227238721938]
テキスト内学習戦略によって導かれるゼロショット設定にセグメンテーション基礎モデルを適用する新しい手法を提案する。
我々のアプローチでは、核、細胞、細胞内のセグメンテーションに3段階のプロセスを導入し、自己増殖機構を導入しています。
本手法は,標準セルセグメンテーションベンチマークと産業関連ヒット評価法の両方で検証する。
論文 参考訳(メタデータ) (2025-08-19T10:07:27Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - Persistent Homology for Structural Characterization in Disordered Systems [6.538609026810757]
障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
粒子の再配置を予測し、大域的な位相を分類するのに非常に効果的で解釈可能であることが示されている。
論文 参考訳(メタデータ) (2024-11-21T18:24:06Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Unsupervised hierarchical clustering using the learning dynamics of RBMs [0.0]
Restricted Boltzmann Machine (RBM) の学習力学を利用した関係データツリー構築のための新しい汎用的手法を提案する。
提案手法は,Plefka拡張から派生した平均場アプローチに基づいて,無秩序なシステムの文脈で開発された。
人工的に階層的なデータセットと3つの異なる実世界のデータセット(桁のイメージ、ヒトゲノムの突然変異、タンパク質のファミリー)でテストした。
論文 参考訳(メタデータ) (2023-02-03T16:53:32Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。