論文の概要: A Matrix Variational Auto-Encoder for Variant Effect Prediction in Pharmacogenes
- arxiv url: http://arxiv.org/abs/2507.02624v1
- Date: Thu, 03 Jul 2025 13:50:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.376594
- Title: A Matrix Variational Auto-Encoder for Variant Effect Prediction in Pharmacogenes
- Title(参考訳): マトリックス変分自動エンコーダによる薬剤師効果予測
- Authors: Antoine Honoré, Borja Rodríguez Gálvez, Yoomi Park, Yitian Zhou, Volker M. Lauschke, Ming Xiao,
- Abstract要約: 本稿では,前もって構造化された行列変分自動エンコーダ(matVAE)を提案する。
我々はDMS(Deep mutational scanning, DMS)データセットを26の薬物標的およびADMEタンパク質に対応させて評価した。
我々のモデルはMSA(matVAE-MSA)で訓練され、DMSデータセットのゼロショット予測において最先端のDeepSequenceモデルより優れている。
- 参考スコア(独自算出の注目度): 9.316811342279955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Variant effect predictors (VEPs) aim to assess the functional impact of protein variants, traditionally relying on multiple sequence alignments (MSAs). This approach assumes that naturally occurring variants are fit, an assumption challenged by pharmacogenomics, where some pharmacogenes experience low evolutionary pressure. Deep mutational scanning (DMS) datasets provide an alternative by offering quantitative fitness scores for variants. In this work, we propose a transformer-based matrix variational auto-encoder (matVAE) with a structured prior and evaluate its performance on 33 DMS datasets corresponding to 26 drug target and ADME proteins from the ProteinGym benchmark. Our model trained on MSAs (matVAE-MSA) outperforms the state-of-the-art DeepSequence model in zero-shot prediction on DMS datasets, despite using an order of magnitude fewer parameters and requiring less computation at inference time. We also compare matVAE-MSA to matENC-DMS, a model of similar capacity trained on DMS data, and find that the latter performs better on supervised prediction tasks. Additionally, incorporating AlphaFold-generated structures into our transformer model further improves performance, achieving results comparable to DeepSequence trained on MSAs and finetuned on DMS. These findings highlight the potential of DMS datasets to replace MSAs without significant loss in predictive performance, motivating further development of DMS datasets and exploration of their relationships to enhance variant effect prediction.
- Abstract(参考訳): 変数効果予測器(VEPs)は、伝統的に複数の配列アライメント(MSA)に依存するタンパク質変異体の機能的影響を評価することを目的としている。
このアプローチは、自然に生じる変異が適合していると仮定し、一部の薬理ゲノミクスが低い進化的な圧力を経験する薬理ゲノミクスに挑戦する仮定である。
深部突然変異スキャン(DMS)データセットは、変種に対する定量的適合度スコアを提供することによって、代替手段を提供する。
そこで本研究では,タンパクGymベンチマークから得られた26の薬物標的およびADMEタンパク質に対応する33のDMSデータセットに対して,事前構造を持つトランスフォーマーベースのマトリックス変量自動エンコーダ(matVAE)を提案する。
また,MSA(matVAE-MSA)を用いたモデルでは,DMSデータセットのゼロショット予測において,パラメータの桁数を桁違いに減らし,推論時に計算量が少ないにもかかわらず,最先端のDeepSequenceモデルよりも優れていた。
また、DMSデータに基づいて訓練された類似容量のモデルである matVAE-MSA と matENC-DMS を比較し、後者が教師付き予測タスクでより良い性能を発揮することを発見した。
さらに、当社のトランスモデルにAlphaFold生成構造を組み込むことにより、パフォーマンスが向上し、MSAでトレーニングされたDeepSequenceに匹敵し、DMSで微調整された結果が得られる。
これらの知見は,DMSデータセットが,予測性能に大きな損失を伴わずにMSAを置き換える可能性を強調し,DMSデータセットのさらなる開発を動機付け,その関連性を探究し,変動効果を予測する。
関連論文リスト
- MaskSDM with Shapley values to improve flexibility, robustness, and explainability in species distribution modeling [3.428447509258587]
種分布モデル(SDM)は生物多様性の研究、保全計画、生態ニッチモデリングにおいて重要な役割を担っている。
マスク付きトレーニング戦略を用いてフレキシブルな予測器選択を可能にする,新しいディープラーニングベースのSDMであるMaskSDMを紹介する。
我々はグローバルなsPlotOpenデータセット上でMaskSDMを評価し,12,738種の分布をモデル化した。
論文 参考訳(メタデータ) (2025-03-17T11:02:28Z) - Generative Principal Component Regression via Variational Inference [2.4415762506639944]
適切な操作を設計するための1つのアプローチは、予測モデルの重要な特徴をターゲットとすることである。
我々は,そのような情報を潜在空間で表現する,教師付き変分オートエンコーダ(SVAE)に基づく新しい目的を開発する。
シミュレーションでは,gPCRは通常のPCRやSVAEと比較して,操作時のターゲット選択を劇的に改善することを示した。
論文 参考訳(メタデータ) (2024-09-03T22:38:55Z) - Geodesic Optimization for Predictive Shift Adaptation on EEG data [53.58711912565724]
ドメイン適応メソッドは、$X$と$y$で分散シフトが同時に発生したときに苦労する。
本稿では,GOPSA(Geodesic Optimization for Predictive Shift Adaptation)と呼ばれる新しい手法を提案する。
GOPSAは、脳波のバイオメディカル応用のための混合効果モデリングと機械学習を併用する可能性を持っている。
論文 参考訳(メタデータ) (2024-07-04T12:15:42Z) - Fine-tuning Protein Language Models with Deep Mutational Scanning improves Variant Effect Prediction [3.2358123775807575]
タンパク質言語モデル(PLM)は、タンパク質コード変異体の機能的影響と臨床的意義を予測するための高性能でスケーラブルなツールとして登場した。
深部突然変異走査法(DMS)による可変効果の実験的マップを用いたPLMの性能向上のための新しい微調整手法を提案する。
これらの結果から,DMSは配列多様性の有望な源であり,多変量効果予測のためのPLMの性能向上のための教師付きトレーニングデータであることが示唆された。
論文 参考訳(メタデータ) (2024-05-10T14:50:40Z) - AI enhanced data assimilation and uncertainty quantification applied to
Geological Carbon Storage [0.0]
本稿では,Surrogate-based hybrid ESMDA (SH-ESMDA)を導入し,Surrogate-based hybrid ESMDA (SH-ESMDA)について述べる。
また,SurrogateをベースとしたHybrid RML(SH-RML)も導入する。
以上の結果より,SH-RMLは従来のESMDAと比較して不確実性が高いことが示唆された。
論文 参考訳(メタデータ) (2024-02-09T00:24:46Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - Synthetic Health-related Longitudinal Data with Mixed-type Variables
Generated using Diffusion Models [2.140861702387444]
本稿では拡散確率モデル(DPM)を用いた電子健康記録のシミュレーション手法を提案する。
数値変数,二項変数,カテゴリー変数を含む混合型変数を捕捉する縦型EHRの合成におけるDPMの有効性を示す。
論文 参考訳(メタデータ) (2023-03-22T03:15:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。