論文の概要: Efficient HLA imputation from sequential SNPs data by Transformer
- arxiv url: http://arxiv.org/abs/2211.06430v1
- Date: Fri, 11 Nov 2022 12:11:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 19:52:56.595218
- Title: Efficient HLA imputation from sequential SNPs data by Transformer
- Title(参考訳): Transformerによる逐次SNPデータからの効率的なHLA計算
- Authors: Kaho Tanaka, Kosuke Kato, Naoki Nonaka, Jun Seita
- Abstract要約: Transformer-based model to impute HLA alleles "HLA Reliable IMputatioN by Transformer (HLARIMNT)"
HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human leukocyte antigen (HLA) genes are associated with a variety of
diseases, however direct typing of HLA is time and cost consuming. Thus various
imputation methods using sequential SNPs data have been proposed based on
statistical or deep learning models, e.g. CNN-based model, named DEEP*HLA.
However, imputation efficiency is not sufficient for in frequent alleles and a
large size of reference panel is required. Here, we developed a
Transformer-based model to impute HLA alleles, named "HLA Reliable IMputatioN
by Transformer (HLARIMNT)" to take advantage of sequential nature of SNPs data.
We validated the performance of HLARIMNT using two different reference panels;
Pan-Asian reference panel (n = 530) and Type 1 Diabetes Genetics Consortium
(T1DGC) reference panel (n = 5,225), as well as the mixture of those two panels
(n = 1,060). HLARIMNT achieved higher accuracy than DEEP*HLA by several
indices, especially for infrequent alleles. We also varied the size of data
used for training, and HLARIMNT imputed more accurately among any size of
training data. These results suggest that Transformer-based model may impute
efficiently not only HLA types but also any other gene types from sequential
SNPs data.
- Abstract(参考訳): ヒト白血球抗原(HLA)遺伝子は様々な疾患と関連しているが、HLAの直接型付けには時間と費用がかかる。
このように、逐次SNPデータを用いた様々な計算手法が、統計モデルや深層学習モデルに基づいて提案されている。
しかし、頻繁な対立遺伝子ではインプテーション効率が不十分であり、大きな参照パネルが必要となる。
そこで我々は,HLAアレルをインプットする Transformer-based model を開発し,SNP データの逐次的性質を活用するために "HLA Reliable IMputatioN by Transformer (HLARIMNT)" と名付けた。
2つの異なる基準パネル、pan-asian reference panel (n = 530) とtype 1 diabetes genetics consortium (t1dgc) reference panel (n = 5,225) およびこれら2つのパネル (n = 1,060) の混合物を用いてhlarimntの性能を検証する。
HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。
また,トレーニング用データのサイズも変化しており,トレーニング用データのサイズよりもHLARIMNTの方が精度が高かった。
これらの結果から,トランスフォーマーモデルがhla型だけでなく,snpsデータから他の遺伝子型を効率的に誘導する可能性が示唆された。
関連論文リスト
- The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - A Hybrid Machine Learning Model for Classifying Gene Mutations in Cancer
using LSTM, BiLSTM, CNN, GRU, and GloVe [0.0]
本研究では、LSTM、BiLSTM、CNN、GRU、GloVeを組み合わせて遺伝子変異を分類するアンサンブルモデルを提案する。
その結果、BERT、Electra、Roberta、XLNet、Distilbert、LSTMアンサンブルといった有名なトランスフォーマーと比較された。
論文 参考訳(メタデータ) (2023-07-24T21:01:46Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - Post-training Model Quantization Using GANs for Synthetic Data
Generation [57.40733249681334]
量子化法における実データを用いたキャリブレーションの代用として合成データを用いた場合について検討する。
本稿では,StyleGAN2-ADAが生成したデータと事前学習したDiStyleGANを用いて定量化したモデルの性能と,実データを用いた量子化とフラクタル画像に基づく代替データ生成手法との比較を行った。
論文 参考訳(メタデータ) (2023-05-10T11:10:09Z) - A Multimodal Graph Neural Network Framework of Cancer Molecular Subtype
Classification [0.27195102129094995]
本稿では, 癌サブタイプ分類の正確かつ堅牢な分類のための, エンドツーエンドマルチオミクスGNNフレームワークを提案する。
分子サブタイプおよび癌サブタイプ分類のためのTGAパン癌データセットとTGA乳がんデータセットを用いて提案モデルを検証した。
論文 参考訳(メタデータ) (2023-02-24T15:36:28Z) - A Light-weight CNN Model for Efficient Parkinson's Disease Diagnostics [1.382077805849933]
提案モデルは,時系列信号の特性を適応させるために,畳み込みニューラルネットワーク(CNN)から短期記憶(LSTM)へと変換される。
実験結果から,提案モデルでは,パラメータや操作がはるかに少ない複数の評価指標に対して,高品質な診断結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-02-02T09:49:07Z) - ADT-SSL: Adaptive Dual-Threshold for Semi-Supervised Learning [68.53717108812297]
Semi-Supervised Learning (SSL)は、ラベル付きデータとラベルなしデータを併用してモデルをトレーニングすることで、高度な分類タスクを実現している。
本稿では,半教師付き学習(ADT-SSL)のための適応的デュアル閾値法を提案する。
実験の結果,提案したADT-SSLは最先端の分類精度を実現することがわかった。
論文 参考訳(メタデータ) (2022-05-21T11:52:08Z) - Generation of Differentially Private Heterogeneous Electronic Health
Records [9.926231893220061]
本稿では, 合成異種EHRの生成にジェネレーティブ・アドバーサリアル・ネットワークを用いて検討する。
本稿では,DP 合成 EHR データセットを作成するために,差分プライバシ(DP)保存最適化の適用について検討する。
論文 参考訳(メタデータ) (2020-06-05T13:21:46Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。