論文の概要: Efficient HLA imputation from sequential SNPs data by Transformer
- arxiv url: http://arxiv.org/abs/2211.06430v1
- Date: Fri, 11 Nov 2022 12:11:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 19:52:56.595218
- Title: Efficient HLA imputation from sequential SNPs data by Transformer
- Title(参考訳): Transformerによる逐次SNPデータからの効率的なHLA計算
- Authors: Kaho Tanaka, Kosuke Kato, Naoki Nonaka, Jun Seita
- Abstract要約: Transformer-based model to impute HLA alleles "HLA Reliable IMputatioN by Transformer (HLARIMNT)"
HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human leukocyte antigen (HLA) genes are associated with a variety of
diseases, however direct typing of HLA is time and cost consuming. Thus various
imputation methods using sequential SNPs data have been proposed based on
statistical or deep learning models, e.g. CNN-based model, named DEEP*HLA.
However, imputation efficiency is not sufficient for in frequent alleles and a
large size of reference panel is required. Here, we developed a
Transformer-based model to impute HLA alleles, named "HLA Reliable IMputatioN
by Transformer (HLARIMNT)" to take advantage of sequential nature of SNPs data.
We validated the performance of HLARIMNT using two different reference panels;
Pan-Asian reference panel (n = 530) and Type 1 Diabetes Genetics Consortium
(T1DGC) reference panel (n = 5,225), as well as the mixture of those two panels
(n = 1,060). HLARIMNT achieved higher accuracy than DEEP*HLA by several
indices, especially for infrequent alleles. We also varied the size of data
used for training, and HLARIMNT imputed more accurately among any size of
training data. These results suggest that Transformer-based model may impute
efficiently not only HLA types but also any other gene types from sequential
SNPs data.
- Abstract(参考訳): ヒト白血球抗原(HLA)遺伝子は様々な疾患と関連しているが、HLAの直接型付けには時間と費用がかかる。
このように、逐次SNPデータを用いた様々な計算手法が、統計モデルや深層学習モデルに基づいて提案されている。
しかし、頻繁な対立遺伝子ではインプテーション効率が不十分であり、大きな参照パネルが必要となる。
そこで我々は,HLAアレルをインプットする Transformer-based model を開発し,SNP データの逐次的性質を活用するために "HLA Reliable IMputatioN by Transformer (HLARIMNT)" と名付けた。
2つの異なる基準パネル、pan-asian reference panel (n = 530) とtype 1 diabetes genetics consortium (t1dgc) reference panel (n = 5,225) およびこれら2つのパネル (n = 1,060) の混合物を用いてhlarimntの性能を検証する。
HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。
また,トレーニング用データのサイズも変化しており,トレーニング用データのサイズよりもHLARIMNTの方が精度が高かった。
これらの結果から,トランスフォーマーモデルがhla型だけでなく,snpsデータから他の遺伝子型を効率的に誘導する可能性が示唆された。
関連論文リスト
- One-Step Diffusion Distillation through Score Implicit Matching [74.91234358410281]
本稿では,Score Implicit Matching (SIM) を用いて,事前学習した拡散モデルを単一ステップジェネレータモデルに蒸留する手法を提案する。
SIMはワンステップジェネレータに対して強い経験的性能を示す。
リードトランスに基づく拡散モデルにSIMを適用することにより,テキスト・ツー・イメージ生成のための単一ステップ生成器を蒸留する。
論文 参考訳(メタデータ) (2024-10-22T08:17:20Z) - A Comparative Study of Hybrid Models in Health Misinformation Text Classification [0.43695508295565777]
本研究では、オンラインソーシャルネットワーク(OSN)上での新型コロナウイルス関連誤情報検出における機械学習(ML)モデルとディープラーニング(DL)モデルの有効性を評価する。
本研究は, 従来のMLアルゴリズムよりも, DLおよびハイブリッドDLモデルの方が, OSN上の新型コロナウイルスの誤情報を検出するのに有効であることが示唆された。
論文 参考訳(メタデータ) (2024-10-08T19:43:37Z) - FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313 [0.587470288031402]
Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。
本稿では,任意の遺伝子型チップとゲノム領域にまたがって一般化可能なクライアント側インプットモデルをサポートする,新しい遺伝子型インプットパイプラインのベースラインを紹介する。
本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-07-12T15:28:13Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - Post-training Model Quantization Using GANs for Synthetic Data
Generation [57.40733249681334]
量子化法における実データを用いたキャリブレーションの代用として合成データを用いた場合について検討する。
本稿では,StyleGAN2-ADAが生成したデータと事前学習したDiStyleGANを用いて定量化したモデルの性能と,実データを用いた量子化とフラクタル画像に基づく代替データ生成手法との比較を行った。
論文 参考訳(メタデータ) (2023-05-10T11:10:09Z) - A Light-weight CNN Model for Efficient Parkinson's Disease Diagnostics [1.382077805849933]
提案モデルは,時系列信号の特性を適応させるために,畳み込みニューラルネットワーク(CNN)から短期記憶(LSTM)へと変換される。
実験結果から,提案モデルでは,パラメータや操作がはるかに少ない複数の評価指標に対して,高品質な診断結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-02-02T09:49:07Z) - ADT-SSL: Adaptive Dual-Threshold for Semi-Supervised Learning [68.53717108812297]
Semi-Supervised Learning (SSL)は、ラベル付きデータとラベルなしデータを併用してモデルをトレーニングすることで、高度な分類タスクを実現している。
本稿では,半教師付き学習(ADT-SSL)のための適応的デュアル閾値法を提案する。
実験の結果,提案したADT-SSLは最先端の分類精度を実現することがわかった。
論文 参考訳(メタデータ) (2022-05-21T11:52:08Z) - Generation of Differentially Private Heterogeneous Electronic Health
Records [9.926231893220061]
本稿では, 合成異種EHRの生成にジェネレーティブ・アドバーサリアル・ネットワークを用いて検討する。
本稿では,DP 合成 EHR データセットを作成するために,差分プライバシ(DP)保存最適化の適用について検討する。
論文 参考訳(メタデータ) (2020-06-05T13:21:46Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。