論文の概要: Deep Contextual Learners for Protein Networks
- arxiv url: http://arxiv.org/abs/2106.02246v1
- Date: Fri, 4 Jun 2021 04:26:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 05:27:33.858223
- Title: Deep Contextual Learners for Protein Networks
- Title(参考訳): タンパク質ネットワークの深層学習
- Authors: Michelle M. Li, Marinka Zitnik
- Abstract要約: 本稿では,タンパク質の埋め込みに細胞および組織コンテキストを注入するグラフニューラルメッセージパッシングアプローチであるAWAREを紹介する。
AWAREは、タンパク質、細胞型、組織埋め込みを学習し、細胞型と組織階層を保持する。
AWAREは、遺伝子が疾患に関連付けられているか、そして人体に最も出現する可能性が最も高いかを予測するための新しい課題について実証する。
- 参考スコア(独自算出の注目度): 16.599890339599586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial context is central to understanding health and disease. Yet reference
protein interaction networks lack such contextualization, thereby limiting the
study of where protein interactions likely occur in the human body.
Contextualized protein interactions could better characterize genes with
disease-specific interactions and elucidate diseases' manifestation in specific
cell types. Here, we introduce AWARE, a graph neural message passing approach
to inject cellular and tissue context into protein embeddings. AWARE optimizes
for a multi-scale embedding space, whose structure reflects the topology of
cell type specific networks. We construct a multi-scale network of the Human
Cell Atlas and apply AWARE to learn protein, cell type, and tissue embeddings
that uphold cell type and tissue hierarchies. We demonstrate AWARE on the novel
task of predicting whether a gene is associated with a disease and where it
most likely manifests in the human body. AWARE embeddings outperform global
embeddings by at least 12.5%, highlighting the importance of contextual
learners for protein networks.
- Abstract(参考訳): 空間的文脈は健康と病気の理解の中心である。
しかし、参照タンパク質相互作用ネットワークはそのような文脈化を欠いているため、タンパク質相互作用が人体でどこで起こるかの研究が制限される。
コンテクスト化タンパク質相互作用は、疾患特異的な相互作用を持つ遺伝子を同定し、特定の細胞型における疾患の出現を解明する。
本稿では,タンパク質の埋め込みに細胞および組織コンテキストを注入するグラフニューラルメッセージパッシングアプローチであるAWAREを紹介する。
awareは、セルタイプ特定ネットワークのトポロジーを反映した構造を持つマルチスケール埋め込み空間を最適化する。
我々は、ヒト細胞アトラスのマルチスケールネットワークを構築し、認識して、細胞タイプと組織階層を保持するタンパク質、細胞タイプ、および組織埋め込みを学習する。
AWAREは、遺伝子が疾患に関連付けられているか、そして人体に最も現れるかを予測する新しいタスクについて実証する。
aware embeddedsは、グローバル埋め込みを少なくとも12.5%上回り、タンパク質ネットワークにおける文脈学習者の重要性を強調している。
関連論文リスト
- Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Zyxin is all you need: machine learning adherent cell mechanics [0.0]
データ駆動型生体物理モデリング手法を開発し、接着細胞の力学的挙動を学習する。
まず、細胞骨格タンパク質の画像から付着細胞が生成する力を予測するためにニューラルネットワークを訓練する。
次に、我々は、細胞力のデータ駆動モデルを構築するのに役立つ2つのアプローチ(一つは物理学によって明示的に制約された、もう一つは連続体)を開発します。
論文 参考訳(メタデータ) (2023-03-01T02:08:40Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Subcellular Protein Localisation in the Human Protein Atlas using
Ensembles of Diverse Deep Architectures [11.41081495236219]
細胞内タンパク質の視覚的局在の自動化は、健康と病気における細胞機能の理解を加速させる。
i)細胞アノテーションの品質の自動改善、(ii)不均衡でノイズの多いデータをサポートする新しい畳み込みニューラルネットワーク(CNN)アーキテクチャ、(iii)多種多様な機械学習モデルの選択と融合という3つの重要な側面に対処することで、このギャップを狭めることができることを示す。
論文 参考訳(メタデータ) (2022-05-19T20:28:56Z) - Global Mapping of Gene/Protein Interactions in PubMed Abstracts: A
Framework and an Experiment with P53 Interactions [7.361249273831739]
多くの生物医学文献は、遺伝子/タンパク質の相互作用情報の重要な情報源である。
テキストマイニングツールの最近の進歩により、自由テキスト文学からこのような文書化された相互作用を自動的に抽出することが可能になった。
本稿では,生物医学文献リポジトリから抽出した遺伝子/タンパク質相互作用に基づいて,大規模遺伝子機能ネットワークの構築と解析を行う包括的フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-22T03:04:19Z) - A multitask transfer learning framework for the prediction of
virus-human protein-protein interactions [0.30586855806896046]
我々は、約2400万のタンパク質配列の情報と、ヒトの相互作用系からの相互作用パターンを利用する転写学習手法を開発した。
我々は、ヒトタンパク質とタンパク質の相互作用を観測する確率を最大化することを目的とした追加の目的を用いる。
実験結果から,本モデルがウイルス-ヒト-ヒト-ヒト-タンパク質相互作用予測タスクに有効であることが示された。
論文 参考訳(メタデータ) (2021-11-26T07:53:51Z) - Bio-JOIE: Joint Representation Learning of Biological Knowledge Bases [38.9571812880758]
バイオジョイは、sars-cov-2タンパク質とヒトタンパク質のppisを正確に同定できる。
構造化知識のみを活用することにより、Bio-JOIEはPPI型予測において、既存の最先端の手法よりも著しく優れている。
論文 参考訳(メタデータ) (2021-03-07T07:06:53Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。