論文の概要: Advancing Cancer Prognosis with Hierarchical Fusion of Genomic, Proteomic and Pathology Imaging Data from a Systems Biology Perspective
- arxiv url: http://arxiv.org/abs/2603.13787v1
- Date: Sat, 14 Mar 2026 06:30:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.40633
- Title: Advancing Cancer Prognosis with Hierarchical Fusion of Genomic, Proteomic and Pathology Imaging Data from a Systems Biology Perspective
- Title(参考訳): ゲノム・プロテオミクス・病理画像データの階層融合による癌予後の改善 : システム生物学の観点から
- Authors: Junjie Zhou, Bao Xue, Meiling Wang, Wei Shao, Daoqiang Zhang,
- Abstract要約: システム生物学の観点から,遺伝子からタンパク質への生物学的進化をモデル化する階層的融合フレームワークであるHFGPIを提案する。
具体的には、遺伝子やタンパク質の生物学的情報表現を構築するために、アイデンティティ埋め込みと表現プロファイルを統合する分子エンコーディング戦略である、分子トケナイザーを紹介する。
次に、構造タンパク質アライメントにグラフ認識のクロスアテンションを用いて、遺伝子保存制御関係を明示的にモデル化し、遺伝子制御タンパク質表現を生成する遺伝子制御タンパク質融合(GRPF)を開発した。
- 参考スコア(独自算出の注目度): 28.350872729693847
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To enhance the precision of cancer prognosis, recent research has increasingly focused on multimodal survival methods by integrating genomic data and histology images. However, current approaches overlook the fact that the proteome serves as an intermediate layer bridging genomic alterations and histopathological features while providing complementary biological information essential for survival prediction. This biological reality exposes another architectural limitation: existing integrative analysis studies fuse these heterogeneous data sources in a flat manner that fails to capture their inherent biological hierarchy. To address these limitations, we propose HFGPI, a hierarchical fusion framework that models the biological progression from genes to proteins to histology images from a systems biology perspective. Specifically, we introduce Molecular Tokenizer, a molecular encoding strategy that integrates identity embeddings with expression profiles to construct biologically informed representations for genes and proteins. We then develop Gene-Regulated Protein Fusion (GRPF), which employs graph-aware cross-attention with structure-preserving alignment to explicitly model gene-protein regulatory relationships and generate gene-regulated protein representations. Additionally, we propose Protein-Guided Hypergraph Learning (PGHL), which establishes associations between proteins and image patches, leveraging hypergraph convolution to capture higher-order protein-morphology relationships. The final features are progressively fused across hierarchical layers to achieve precise survival outcome prediction. Extensive experiments on five benchmark datasets demonstrate the superiority of HFGPI over state-of-the-art methods.
- Abstract(参考訳): 癌予後の精度を高めるため、最近の研究ではゲノムデータと組織像を統合することで、多モーダルサバイバル手法に重点を置いている。
しかし、現在のアプローチでは、プロテオームが、生存予測に不可欠な補完的な生物学的情報を提供しながら、ゲノム改変と病理学的特徴をブリッジする中間層として機能するという事実を見落としている。
既存の統合分析研究は、これらの不均一なデータソースを平らな方法で融合させ、それら固有の生物学的階層を捉えるのに失敗する。
これらの制約に対処するため,システム生物学の観点から,遺伝子からタンパク質への生物学的進化をモデル化する階層的な融合フレームワークであるHFGPIを提案する。
具体的には、遺伝子やタンパク質の生物学的情報表現を構築するために、アイデンティティ埋め込みと表現プロファイルを統合する分子エンコーディング戦略である、分子トケナイザーを紹介する。
次に,遺伝子制御タンパク質融合 (GRPF) を開発し, 構造保存アライメントとグラフ認識のクロスアテンションを用いて, 遺伝子とタンパク質の関係を明示的にモデル化し, 遺伝子制御タンパク質の表現を生成する。
さらに,タンパク質と画像パッチの関連性を確立し,高次タンパク質-形態的関係を捉えるためにハイパーグラフ畳み込みを活用し,PGHL(Protein-Guided Hypergraph Learning)を提案する。
最終機能は階層層に徐々に融合し、正確な生存率予測が達成される。
5つのベンチマークデータセットに対する大規模な実験は、最先端の手法よりもHFGPIの方が優れていることを示した。
関連論文リスト
- Hierarchical Multi-Label Contrastive Learning for Protein-Protein Interaction Prediction Across Organisms [2.399426243085768]
タンパク質間相互作用予測のための階層的コントラストフレームワークであるHIPPOを提案する。
提案手法は、タンパク質の機能クラス間の構造的関係をエミュレートする階層的コントラスト損失関数を含む。
ベンチマークデータセットの実験では、HIPPOが最先端のパフォーマンスを達成し、既存のメソッドを上回り、低データのレシエーションにおいて堅牢性を示すことが示されている。
論文 参考訳(メタデータ) (2025-07-03T15:41:04Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Pathology-genomic fusion via biologically informed cross-modality graph learning for survival analysis [7.996257103473235]
そこで我々は,全スライド画像(WSI)とバルクRNA-Seq発現データと異種グラフニューラルネットワークを統合したPGHG(Pathology-Genome Heterogeneous Graph)を提案する。
PGHGは生物学的知識誘導表現学習ネットワークと病理ゲノム不均一グラフから構成される。
腫瘍ゲノムアトラスの低悪性度グリオーマ,グリオーマ,腎乳頭状細胞癌データセットについて検討した。
論文 参考訳(メタデータ) (2024-04-11T09:07:40Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Bio-JOIE: Joint Representation Learning of Biological Knowledge Bases [38.9571812880758]
バイオジョイは、sars-cov-2タンパク質とヒトタンパク質のppisを正確に同定できる。
構造化知識のみを活用することにより、Bio-JOIEはPPI型予測において、既存の最先端の手法よりも著しく優れている。
論文 参考訳(メタデータ) (2021-03-07T07:06:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。