論文の概要: Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification
- arxiv url: http://arxiv.org/abs/2406.02990v1
- Date: Wed, 5 Jun 2024 06:42:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 19:39:21.357155
- Title: Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification
- Title(参考訳): バイオメディカル・言語知識を用いた全スライド画像からの遺伝的変異の予測
- Authors: Gexin Huang, Chenfei Wu, Mingjie Li, Xiaojun Chang, Ling Chen, Ying Sun, Shen Zhao, Xiaodan Liang, Liang Lin,
- Abstract要約: 遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
- 参考スコア(独自算出の注目度): 119.13058298388101
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Predicting genetic mutations from whole slide images is indispensable for cancer diagnosis. However, existing work training multiple binary classification models faces two challenges: (a) Training multiple binary classifiers is inefficient and would inevitably lead to a class imbalance problem. (b) The biological relationships among genes are overlooked, which limits the prediction performance. To tackle these challenges, we innovatively design a Biological-knowledge enhanced PathGenomic multi-label Transformer to improve genetic mutation prediction performances. BPGT first establishes a novel gene encoder that constructs gene priors by two carefully designed modules: (a) A gene graph whose node features are the genes' linguistic descriptions and the cancer phenotype, with edges modeled by genes' pathway associations and mutation consistencies. (b) A knowledge association module that fuses linguistic and biomedical knowledge into gene priors by transformer-based graph representation learning, capturing the intrinsic relationships between different genes' mutations. BPGT then designs a label decoder that finally performs genetic mutation prediction by two tailored modules: (a) A modality fusion module that firstly fuses the gene priors with critical regions in WSIs and obtains gene-wise mutation logits. (b) A comparative multi-label loss that emphasizes the inherent comparisons among mutation status to enhance the discrimination capabilities. Sufficient experiments on The Cancer Genome Atlas benchmark demonstrate that BPGT outperforms the state-of-the-art.
- Abstract(参考訳): スライド画像全体から遺伝子変異を予測することは、がんの診断には不可欠である。
しかし、既存の作業トレーニング 複数のバイナリ分類モデルは、以下の2つの課題に直面している。
(a)複数のバイナリ分類器の訓練は非効率であり、必然的にクラス不均衡の問題を引き起こす。
b) 遺伝子間の生物学的関係は見過ごされ, 予測性能が制限される。
これらの課題に対処するために、遺伝子変異予測性能を改善するために、生物知識を改良したPathGenomic Multi-label Transformerを革新的に設計する。
BPGTは、まず2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
a) ノードの特徴を有する遺伝子グラフは、遺伝子の言語学的記述と癌表現型であり、そのエッジは遺伝子の経路関連と突然変異の相同性によってモデル化されている。
b)トランスフォーマーに基づくグラフ表現学習により、言語的および生医学的知識を遺伝子優先に融合させ、異なる遺伝子の突然変異間の本質的な関係を捉える知識関連モジュール。
BPGTはそれからラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
a) まず、WSIの臨界領域に遺伝子前駆体を融合させ、遺伝子ワイドな突然変異ロジットを得るモダリティ融合モジュール。
b) 識別能力を高めるため,変異状態の固有比較を強調した比較多ラベル損失について検討した。
The Cancer Genome Atlasベンチマークの十分な実験は、BPGTが最先端の技術を上回ることを示した。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - Gene Regulatory Network Inference in the Presence of Selection Bias and Latent Confounders [14.626706466908386]
Gene Regulatory Network Inference (GRNI) は遺伝子発現データを用いて遺伝子間の因果関係を同定することを目的としている。
遺伝子発現は非コーディングRNAのような潜伏した共同設立者の影響を受けており、GRNIに複雑さを増す。
本稿では,選択バイアスと潜在的共同設立者の存在下でのGISL(Gene Regulatory Network Inference in the presence of Selection bias and Latent Confounders)を提案する。
論文 参考訳(メタデータ) (2025-01-17T11:27:58Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Epigenetics Algorithms: Self-Reinforcement-Attention mechanism to
regulate chromosomes expression [0.0]
本稿ではメチル化として知られるエピジェネティックス現象を模倣する新しいエピジェネティックスアルゴリズムを提案する。
エピジェネティックスアルゴリズムの斬新さは、主に注意機構と深層学習を利用しており、遺伝子/サイレンシングの概念とよく適合している。
論文 参考訳(メタデータ) (2023-03-15T21:33:21Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - VEGN: Variant Effect Prediction with Graph Neural Networks [19.59965282985234]
本稿では,遺伝子と変異を持つ異種グラフ上で動作するグラフニューラルネットワーク(GNN)を用いて,変異効果予測をモデル化したVEGNを提案する。
このグラフは、変異体を遺伝子に割り当て、遺伝子-遺伝子相互作用ネットワークに遺伝子を接続することによって作成される。
VeGNは既存の最先端モデルの性能を改善する。
論文 参考訳(メタデータ) (2021-06-25T13:51:46Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。