Fugu-MT 論文翻訳(概要): Efficient HLA imputation from sequential SNPs data by Transformer

論文の概要: Efficient HLA imputation from sequential SNPs data by Transformer

arxiv url: http://arxiv.org/abs/2211.06430v1
Date: Fri, 11 Nov 2022 12:11:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-15 19:52:56.595218
Title: Efficient HLA imputation from sequential SNPs data by Transformer
Title（参考訳）: Transformerによる逐次SNPデータからの効率的なHLA計算
Authors: Kaho Tanaka, Kosuke Kato, Naoki Nonaka, Jun Seita
Abstract要約: Transformer-based model to impute HLA alleles "HLA Reliable IMputatioN by Transformer (HLARIMNT)" HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Human leukocyte antigen (HLA) genes are associated with a variety of diseases, however direct typing of HLA is time and cost consuming. Thus various imputation methods using sequential SNPs data have been proposed based on statistical or deep learning models, e.g. CNN-based model, named DEEP*HLA. However, imputation efficiency is not sufficient for in frequent alleles and a large size of reference panel is required. Here, we developed a Transformer-based model to impute HLA alleles, named "HLA Reliable IMputatioN by Transformer (HLARIMNT)" to take advantage of sequential nature of SNPs data. We validated the performance of HLARIMNT using two different reference panels; Pan-Asian reference panel (n = 530) and Type 1 Diabetes Genetics Consortium (T1DGC) reference panel (n = 5,225), as well as the mixture of those two panels (n = 1,060). HLARIMNT achieved higher accuracy than DEEP*HLA by several indices, especially for infrequent alleles. We also varied the size of data used for training, and HLARIMNT imputed more accurately among any size of training data. These results suggest that Transformer-based model may impute efficiently not only HLA types but also any other gene types from sequential SNPs data.
Abstract（参考訳）: ヒト白血球抗原(HLA)遺伝子は様々な疾患と関連しているが、HLAの直接型付けには時間と費用がかかる。このように、逐次SNPデータを用いた様々な計算手法が、統計モデルや深層学習モデルに基づいて提案されている。しかし、頻繁な対立遺伝子ではインプテーション効率が不十分であり、大きな参照パネルが必要となる。そこで我々は,HLAアレルをインプットする Transformer-based model を開発し,SNP データの逐次的性質を活用するために "HLA Reliable IMputatioN by Transformer (HLARIMNT)" と名付けた。 2つの異なる基準パネル、pan-asian reference panel (n = 530) とtype 1 diabetes genetics consortium (t1dgc) reference panel (n = 5,225) およびこれら2つのパネル (n = 1,060) の混合物を用いてhlarimntの性能を検証する。 HLARIMNTはいくつかの指標によりDEEP*HLAよりも高い精度を達成した。また,トレーニング用データのサイズも変化しており,トレーニング用データのサイズよりもHLARIMNTの方が精度が高かった。これらの結果から,トランスフォーマーモデルがhla型だけでなく,snpsデータから他の遺伝子型を効率的に誘導する可能性が示唆された。

関連論文リスト

Chemical Language Models for Natural Products: A State-Space Model Approach [19.163826483084893]
天然物(NP)は、薬物発見において重要であるにもかかわらず、未発見である。状態空間モデル(MambaとMamba-2)の事前学習によるNP特化化学言語モデル(NPCLM)を開発する。 NPに着目したタスクに対する選択的状態空間モデルと変換器の最初の体系的比較を示す。
論文参考訳（メタデータ） (2026-02-15T02:26:36Z)
Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文参考訳（メタデータ） (2025-07-14T16:19:00Z)
Deep Learning in Renewable Energy Forecasting: A Cross-Dataset Evaluation of Temporal and Spatial Models [7.286091036139208]
本研究は, 早期停止, ニューロン減少, L2正則化などの正規化アプローチを展開し, DLモデルに係わる過度適合問題を軽減した。 LSTMとモデルは優れた性能を示し、検証データは極端に低いルート平均二乗誤差値を示す。
論文参考訳（メタデータ） (2025-05-06T02:05:19Z)
One-Step Diffusion Distillation through Score Implicit Matching [74.91234358410281]
本稿では,Score Implicit Matching (SIM) を用いて,事前学習した拡散モデルを単一ステップジェネレータモデルに蒸留する手法を提案する。 SIMはワンステップジェネレータに対して強い経験的性能を示す。リードトランスに基づく拡散モデルにSIMを適用することにより,テキスト・ツー・イメージ生成のための単一ステップ生成器を蒸留する。
論文参考訳（メタデータ） (2024-10-22T08:17:20Z)
A Comparative Study of Hybrid Models in Health Misinformation Text Classification [0.43695508295565777]
本研究では、オンラインソーシャルネットワーク(OSN)上での新型コロナウイルス関連誤情報検出における機械学習(ML)モデルとディープラーニング(DL)モデルの有効性を評価する。本研究は, 従来のMLアルゴリズムよりも, DLおよびハイブリッドDLモデルの方が, OSN上の新型コロナウイルスの誤情報を検出するのに有効であることが示唆された。
論文参考訳（メタデータ） (2024-10-08T19:43:37Z)
FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313 [0.587470288031402]
Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。本稿では,任意の遺伝子型チップとゲノム領域にまたがって一般化可能なクライアント側インプットモデルをサポートする,新しい遺伝子型インプットパイプラインのベースラインを紹介する。本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
論文参考訳（メタデータ） (2024-07-12T15:28:13Z)
The Languini Kitchen: Enabling Language Modelling Research at Different Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文参考訳（メタデータ） (2023-09-20T10:31:17Z)
Improving Out-of-Distribution Robustness of Classifiers via Generative Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文参考訳（メタデータ） (2023-07-23T03:53:53Z)
A Federated Learning-based Industrial Health Prognostics for Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文参考訳（メタデータ） (2023-05-13T07:20:31Z)
Post-training Model Quantization Using GANs for Synthetic Data Generation [57.40733249681334]
量子化法における実データを用いたキャリブレーションの代用として合成データを用いた場合について検討する。本稿では,StyleGAN2-ADAが生成したデータと事前学習したDiStyleGANを用いて定量化したモデルの性能と,実データを用いた量子化とフラクタル画像に基づく代替データ生成手法との比較を行った。
論文参考訳（メタデータ） (2023-05-10T11:10:09Z)
A Light-weight CNN Model for Efficient Parkinson's Disease Diagnostics [1.382077805849933]
提案モデルは,時系列信号の特性を適応させるために,畳み込みニューラルネットワーク(CNN)から短期記憶(LSTM)へと変換される。実験結果から,提案モデルでは,パラメータや操作がはるかに少ない複数の評価指標に対して,高品質な診断結果が得られることがわかった。
論文参考訳（メタデータ） (2023-02-02T09:49:07Z)
ADT-SSL: Adaptive Dual-Threshold for Semi-Supervised Learning [68.53717108812297]
Semi-Supervised Learning (SSL)は、ラベル付きデータとラベルなしデータを併用してモデルをトレーニングすることで、高度な分類タスクを実現している。本稿では,半教師付き学習(ADT-SSL)のための適応的デュアル閾値法を提案する。実験の結果,提案したADT-SSLは最先端の分類精度を実現することがわかった。
論文参考訳（メタデータ） (2022-05-21T11:52:08Z)
Generation of Differentially Private Heterogeneous Electronic Health Records [9.926231893220061]
本稿では, 合成異種EHRの生成にジェネレーティブ・アドバーサリアル・ネットワークを用いて検討する。本稿では,DP 合成 EHR データセットを作成するために,差分プライバシ(DP)保存最適化の適用について検討する。
論文参考訳（メタデータ） (2020-06-05T13:21:46Z)
A Systematic Approach to Featurization for Cancer Drug Sensitivity Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。 RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文参考訳（メタデータ） (2020-04-30T20:42:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。