論文の概要: Integrating Large Language Models for Genetic Variant Classification
- arxiv url: http://arxiv.org/abs/2411.05055v1
- Date: Thu, 07 Nov 2024 13:45:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:55:10.098300
- Title: Integrating Large Language Models for Genetic Variant Classification
- Title(参考訳): 遺伝的変異分類のための大規模言語モデルの統合
- Authors: Youssef Boulaimen, Gabriele Fossi, Leila Outemzabet, Nathalie Jeanray, Oleksandr Levenets, Stephane Gerart, Sebastien Vachenc, Salvatore Raieli, Joanna Giemza,
- Abstract要約: 大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
- 参考スコア(独自算出の注目度): 12.244115429231888
- License:
- Abstract: The classification of genetic variants, particularly Variants of Uncertain Significance (VUS), poses a significant challenge in clinical genetics and precision medicine. Large Language Models (LLMs) have emerged as transformative tools in this realm. These models can uncover intricate patterns and predictive insights that traditional methods might miss, thus enhancing the predictive accuracy of genetic variant pathogenicity. This study investigates the integration of state-of-the-art LLMs, including GPN-MSA, ESM1b, and AlphaMissense, which leverage DNA and protein sequence data alongside structural insights to form a comprehensive analytical framework for variant classification. Our approach evaluates these integrated models using the well-annotated ProteinGym and ClinVar datasets, setting new benchmarks in classification performance. The models were rigorously tested on a set of challenging variants, demonstrating substantial improvements over existing state-of-the-art tools, especially in handling ambiguous and clinically uncertain variants. The results of this research underline the efficacy of combining multiple modeling approaches to significantly refine the accuracy and reliability of genetic variant classification systems. These findings support the deployment of these advanced computational models in clinical environments, where they can significantly enhance the diagnostic processes for genetic disorders, ultimately pushing the boundaries of personalized medicine by offering more detailed and actionable genetic insights.
- Abstract(参考訳): 遺伝子変異の分類、特に不確かさの変数(VUS)は、臨床遺伝学や精密医療において重要な課題である。
大規模言語モデル(LLM)はこの領域でトランスフォーメーションツールとして登場した。
これらのモデルは、従来の方法が見逃す可能性のある複雑なパターンや予測的な洞察を明らかにすることができ、遺伝的変異病原体の予測精度を高めることができる。
本研究では, GPN-MSA, ESM1b, AlphaMissenseを含む最先端のLSMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価し,分類性能の新たなベンチマークを設定する。
これらのモデルは一連の挑戦的な変種で厳格にテストされ、既存の最先端のツール、特に曖昧で臨床的に不確実な変種を扱う際に、大幅に改善された。
本研究は,遺伝子変異分類システムの精度と信頼性を著しく向上するために,複数のモデリング手法を組み合わせることの有効性について述べる。
これらの知見は、これらの先進的な計算モデルを臨床環境に展開することをサポートし、そこでは遺伝子疾患の診断プロセスを大幅に強化し、最終的にはより詳細で行動可能な遺伝情報を提供することで、パーソナライズされた医療の境界を推し進める。
関連論文リスト
- Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。
本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文 参考訳(メタデータ) (2024-09-03T09:14:21Z) - Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Improved prediction of ligand-protein binding affinities by meta-modeling [1.3859669037499769]
我々は,力場に基づく実証ドッキングとシーケンスに基づくディープラーニングモデルを統合するフレームワークを開発した。
メタモデルの多くがベースモデルに対する親和性予測を大幅に改善していることを示す。
我々の最高のメタモデルは、3D構造のみに基づく最先端のディープラーニングツールに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2023-10-05T23:46:45Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Incorporating Prior Knowledge in Deep Learning Models via Pathway
Activity Autoencoders [5.950889585409067]
本稿では,癌におけるRNA-seqデータのための,事前知識に基づく新しいディープオートエンコーディングフレームワークPAAEを提案する。
機能セットが小さいにもかかわらず,PAAEモデルとPAAEモデルでは,一般的な手法と比較して,アウト・オブ・セットの再現性が向上していることを示す。
論文 参考訳(メタデータ) (2023-06-09T11:12:55Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。