論文の概要: KGOT: Unified Knowledge Graph and Optimal Transport Pseudo-Labeling for Molecule-Protein Interaction Prediction
- arxiv url: http://arxiv.org/abs/2512.09365v1
- Date: Wed, 10 Dec 2025 06:55:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.422743
- Title: KGOT: Unified Knowledge Graph and Optimal Transport Pseudo-Labeling for Molecule-Protein Interaction Prediction
- Title(参考訳): KGOT:分子-タンパク質相互作用予測のための統一知識グラフと最適輸送擬似ラベル
- Authors: Jiayu Qin, Zhengquan Luo, Guy Tadmor, Changyou Chen, David Zeevi, Zhiqiang Xu,
- Abstract要約: 我々は,未標識分子-タンパク質対に対して,高品質な擬似ラベルを生成するための最適輸送ベースアプローチを開発した。
異種生物の多様性をブリッジするメカニズムとして擬似ラベル処理を扱うことにより,異種データの有効利用が可能となった。
仮想スクリーニングタスクやタンパク質検索タスクを含む,複数のMPIデータセット上でのフレームワークの評価を行った。
- 参考スコア(独自算出の注目度): 20.031487150263725
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Predicting molecule-protein interactions (MPIs) is a fundamental task in computational biology, with crucial applications in drug discovery and molecular function annotation. However, existing MPI models face two major challenges. First, the scarcity of labeled molecule-protein pairs significantly limits model performance, as available datasets capture only a small fraction of biological relevant interactions. Second, most methods rely solely on molecular and protein features, ignoring broader biological context such as genes, metabolic pathways, and functional annotations that could provide essential complementary information. To address these limitations, our framework first aggregates diverse biological datasets, including molecular, protein, genes and pathway-level interactions, and then develop an optimal transport-based approach to generate high-quality pseudo-labels for unlabeled molecule-protein pairs, leveraging the underlying distribution of known interactions to guide label assignment. By treating pseudo-labeling as a mechanism for bridging disparate biological modalities, our approach enables the effective use of heterogeneous data to enhance MPI prediction. We evaluate our framework on multiple MPI datasets including virtual screening tasks and protein retrieval tasks, demonstrating substantial improvements over state-of-the-art methods in prediction accuracies and zero shot ability across unseen interactions. Beyond MPI prediction, our approach provides a new paradigm for leveraging diverse biological data sources to tackle problems traditionally constrained by single- or bi-modal learning, paving the way for future advances in computational biology and drug discovery.
- Abstract(参考訳): 分子-タンパク質相互作用の予測(MPIs)は計算生物学の基本的な課題であり、薬物発見および分子機能アノテーションにおいて重要な応用である。
しかし、既存のMPIモデルは2つの大きな課題に直面している。
まず、ラベル付き分子-タンパク質ペアの不足がモデルの性能を著しく制限する。
第二に、ほとんどの方法は、遺伝子、代謝経路、重要な相補的な情報を提供する機能的アノテーションなど、より広範な生物学的文脈を無視し、分子的およびタンパク質的特徴にのみ依存する。
これらの制限に対処するため、我々のフレームワークはまず、分子、タンパク質、遺伝子、経路レベルの相互作用を含む多様な生物学的データセットを集約し、次に、ラベルのない分子とタンパク質のペアに対して高品質な擬似ラベルを生成するための最適なトランスポートベースのアプローチを開発し、既知の相互作用の基盤となる分布を利用してラベルの割り当てをガイドする。
そこで本研究では, 異種データの有効利用により, MPI予測を向上する機構として擬似ラベル処理を応用した。
我々は、仮想スクリーニングタスクやタンパク質検索タスクを含む複数のMPIデータセットに関するフレームワークの評価を行い、予測精度における最先端の手法よりも大幅に改善され、未知の相互作用をまたいだショット能力がゼロになったことを実証した。
MPI予測の他に、我々のアプローチは、多様な生物学的データソースを活用するための新しいパラダイムを提供し、伝統的にシングルモーダル学習やバイモーダル学習によって制約された問題に対処し、計算生物学や薬物発見における将来の進歩の道を開く。
関連論文リスト
- Learning Cell-Aware Hierarchical Multi-Modal Representations for Robust Molecular Modeling [74.25438319700929]
分子と細胞応答の局所的グローバル依存性をモデル化する堅牢なフレームワークであるCHMR(Cell-aware Hierarchical Multi-modal Representations)を提案する。
728タスクにまたがる9つの公開ベンチマークで評価され、CHMRは最先端のベースラインを上回っている。
その結果, 階層認識型マルチモーダル学習による分子表現の信頼性, 生物学的基盤化の利点が示された。
論文 参考訳(メタデータ) (2025-11-26T07:15:00Z) - Towards Interpretable Drug-Drug Interaction Prediction: A Graph-Based Approach with Molecular and Network-Level Explanations [3.6099926707292793]
薬物と薬物の相互作用(DDI)は、薬理学において重要な課題であり、しばしば患者の安全と医療結果に重大な影響を及ぼす有害な薬物反応を引き起こす。
我々は,分子と生物の知識を統合したグラフベースの新しいフレームワークであるMolecBioNetを提案し,ロバストで解釈可能なDDI予測を行う。
論文 参考訳(メタデータ) (2025-07-12T07:43:19Z) - Biological Pathway Guided Gene Selection Through Collaborative Reinforcement Learning [25.2831953927341]
多エージェント強化学習(MARL)を用いた統計的選択と生物学的経路知識を統合する新しい枠組みを提案する。
本フレームワークは,グラフニューラルネットワークによる状態表現による経路知識,遺伝子中心性と経路被覆性を組み合わせた報酬機構,共有メモリと集中的批判コンポーネントを用いた協調学習戦略を取り入れた。
論文 参考訳(メタデータ) (2025-05-30T03:01:07Z) - A Generalist Cross-Domain Molecular Learning Framework for Structure-Based Drug Discovery [32.573496601865465]
構造に基づく薬物発見(Structure-based drug discovery、SBDD)は、標的タンパク質の詳細な物理的構造を利用して新しい薬物を開発する体系的な科学的プロセスである。
生体分子の事前学習モデルの最近の進歩は、様々な生化学的応用において顕著な成功を収めている。
論文 参考訳(メタデータ) (2025-03-06T12:04:56Z) - Binding Affinity Prediction: From Conventional to Machine Learning-Based Approaches [48.66541987908136]
過去数十年間、バインディング親和性を予測するために多くの作業が費やされてきた。
従来の機械学習モデルとディープラーニングモデルの両方を結合親和性を予測するために利用している点に注意が必要だ。
予測性能の改善とFDAの動物試験の廃止により、AI仮想細胞(AIVC)のようなサイリコモデルで駆動されるAIは、結合親和性予測を前進させる可能性がある。
論文 参考訳(メタデータ) (2024-09-30T03:40:49Z) - Learning to Denoise Biomedical Knowledge Graph for Robust Molecular Interaction Prediction [50.7901190642594]
分子間相互作用予測のためのバイオKDN (Biomedical Knowledge Graph Denoising Network) を提案する。
BioKDNは、ノイズの多いリンクを学習可能な方法で識別することで、局所的な部分グラフの信頼性の高い構造を洗練する。
ターゲットの相互作用に関する関係を円滑にすることで、一貫性とロバストなセマンティクスを維持する。
論文 参考訳(メタデータ) (2023-12-09T07:08:00Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Comparative Performance Evaluation of Large Language Models for Extracting Molecular Interactions and Pathway Knowledge [5.893494985371817]
大型言語モデル(LLM)は、関心の経路に関連する遺伝子やタンパク質を同定することができる。
LLMは関心の経路に関連する遺伝子やタンパク質を同定し、その相互作用をある程度予測することができる。
論文 参考訳(メタデータ) (2023-07-17T20:01:11Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。