論文の概要: FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313
- arxiv url: http://arxiv.org/abs/2407.09355v1
- Date: Fri, 12 Jul 2024 15:28:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-15 22:58:40.440922
- Title: FastImpute: A Baseline for Open-source, Reference-Free Genotype Imputation Methods -- A Case Study in PRS313
- Title(参考訳): FastImpute: オープンソースで参照不要な遺伝子型インプットメソッドのベースライン - PRS313のケーススタディ
- Authors: Aaron Ge, Jeya Balasubramanian, Xueyao Wu, Peter Kraft, Jonas S. Almeida,
- Abstract要約: Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。
本稿では,任意の遺伝子型チップとゲノム領域にまたがって一般化可能なクライアント側インプットモデルをサポートする,新しい遺伝子型インプットパイプラインのベースラインを紹介する。
本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 0.587470288031402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Genotype imputation enhances genetic data by predicting missing SNPs using reference haplotype information. Traditional methods leverage linkage disequilibrium (LD) to infer untyped SNP genotypes, relying on the similarity of LD structures between genotyped target sets and fully sequenced reference panels. Recently, reference-free deep learning-based methods have emerged, offering a promising alternative by predicting missing genotypes without external databases, thereby enhancing privacy and accessibility. However, these methods often produce models with tens of millions of parameters, leading to challenges such as the need for substantial computational resources to train and inefficiency for client-sided deployment. Our study addresses these limitations by introducing a baseline for a novel genotype imputation pipeline that supports client-sided imputation models generalizable across any genotyping chip and genomic region. This approach enhances patient privacy by performing imputation directly on edge devices. As a case study, we focus on PRS313, a polygenic risk score comprising 313 SNPs used for breast cancer risk prediction. Utilizing consumer genetic panels such as 23andMe, our model democratizes access to personalized genetic insights by allowing 23andMe users to obtain their PRS313 score. We demonstrate that simple linear regression can significantly improve the accuracy of PRS313 scores when calculated using SNPs imputed from consumer gene panels, such as 23andMe. Our linear regression model achieved an R^2 of 0.86, compared to 0.33 without imputation and 0.28 with simple imputation (substituting missing SNPs with the minor allele frequency). These findings suggest that popular SNP analysis libraries could benefit from integrating linear regression models for genotype imputation, providing a viable and light-weight alternative to reference based imputation.
- Abstract(参考訳): Genotype imputationは、参照ハプロタイプ情報を用いてSNPの欠落を予測することで遺伝データを増強する。
従来の手法では、連鎖不均衡(LD)を利用して、非型付きSNPジェノタイプを推論し、ジェノタイプ化されたターゲットセットと完全にシーケンスされた参照パネルの間のLD構造の類似性に依存する。
近年,参照不要なディープラーニングベースの手法が登場し,外部データベースなしで欠落したジェノタイプを予測し,プライバシとアクセシビリティを向上させることで,有望な代替手段を提供する。
しかしながら、これらの手法は、数千万のパラメータを持つモデルを生成することが多く、クライアント側のデプロイメントに十分な計算リソースをトレーニングする必要や非効率性といった課題に繋がる。
本研究は,任意の遺伝子型チップおよびゲノム領域で一般化可能なクライアント側インプットモデルをサポートする新しい遺伝子型インプットパイプラインのベースラインを導入することで,これらの制約に対処する。
このアプローチは、エッジデバイス上で直接命令を実行することで、患者のプライバシを高める。
症例報告では,乳がんリスク予測に使用される313個のSNPからなる多型性リスクスコアであるPSS313に着目した。
23andMeのような消費者遺伝パネルを利用することで、23andMeユーザーがPSS313のスコアを得られるようにすることで、パーソナライズされた遺伝情報へのアクセスを民主化する。
本研究では,23andMeなどの消費者遺伝子パネルからのSNPを用いて計算すると,単純な線形回帰がPSS313スコアの精度を大幅に向上することを示した。
線形回帰モデルではR^2が0.86であり, 命令なし0.33, 単純な命令付き0.28であった。
これらの結果から、一般的なSNP解析ライブラリは、ジェノタイプインパルスの線形回帰モデルを統合することで、参照ベースインパルスの代替として可能で軽量な代替手段を提供することができることが示唆された。
関連論文リスト
- Segmentation of Non-Small Cell Lung Carcinomas: Introducing DRU-Net and Multi-Lens Distortion [0.1935997508026988]
我々は,ヒト非小細胞肺癌の悪性度を規定するセグメンテーションモデル(DRU-Net)を提案している。
我々は提案したモデルを作成するために2つのデータセット(ノルウェーの肺がんバイオバンクとHaukeland大学肺がんコホート)を使用した。
提案した空間拡張法(マルチレンズ歪み)により,ネットワーク性能は3%向上した。
論文 参考訳(メタデータ) (2024-06-20T13:14:00Z) - Kernel Cox partially linear regression: building predictive models for
cancer patients' survival [4.230753712933184]
我々はカーネルCox比例ハザード半パラメトリックモデルを構築し、モデルに適合する新しい正規化ニンジン化カーネルマシン(RegGKM)を提案する。
我々はカーネルマシン法を用いて生存率と予測値の複雑な関係を記述し、無関係なパラメトリックおよび非パラメトリック予測値を自動的に除去する。
この結果は、患者を異なる死亡リスクを持つグループに分類し、より良い臨床結果を得るために治療を促進するのに役立つ。
論文 参考訳(メタデータ) (2023-10-11T04:27:54Z) - Developing a Novel Image Marker to Predict the Clinical Outcome of Neoadjuvant Chemotherapy (NACT) for Ovarian Cancer Patients [1.7623658472574557]
ネオアジュバント化学療法(ネオアジュバントセラピー、Neoadjuvant chemotherapy, NACT)は、卵巣がんの進行期における治療法の一つ。
NACTに対する部分的反応は、近位部破裂手術を引き起こす可能性があり、予後不良を引き起こす。
我々は,NATの早期に高精度な予後予測を実現するために,新しい画像マーカーを開発した。
論文 参考訳(メタデータ) (2023-09-13T16:59:50Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - Optimize Deep Learning Models for Prediction of Gene Mutations Using
Unsupervised Clustering [6.494144125433731]
ディープ・ラーニング(Deep Learning)は、全スライディングのデジタル病理画像の解析と解釈において、主流の方法論選択となっている。
本稿では, 教師なしクラスタリングに基づくマルチインスタンス学習を提案するとともに, 3種類の癌からのWSIを用いた遺伝子変異予測のための深層学習モデルの構築に本手法を適用した。
画像パッチの教師なしクラスタリングは, 予測パッチの同定, 予測情報の欠如を排除し, 3種類の癌における遺伝子変異の予測を改善できることを示した。
論文 参考訳(メタデータ) (2022-03-31T11:48:21Z) - Segmentation by Test-Time Optimization (TTO) for CBCT-based Adaptive
Radiation Therapy [2.5705729402510338]
従来型または深層学習(DL)に基づく変形可能な画像登録(DIR)は、多くの状況において改善された結果が得られる。
本稿では,事前学習したDLベースのDIR集団モデルを洗練するためのテスト時間最適化(TTO)手法を提案する。
提案手法は,一般化可能性問題の影響を受けにくく,DLベースのDIRモデルの全体的な性能を向上させることができる。
論文 参考訳(メタデータ) (2022-02-08T16:34:22Z) - Wide & Deep neural network model for patch aggregation in CNN-based
prostate cancer detection systems [51.19354417900591]
前立腺癌(PCa)は、2020年に約141万件の新規感染者と約37万5000人の死者を出した男性の死因の1つである。
自動診断を行うには、まず前立腺組織サンプルをギガピクセル分解能全スライド画像にデジタイズする。
パッチと呼ばれる小さなサブイメージが抽出され、予測され、パッチレベルの分類が得られる。
論文 参考訳(メタデータ) (2021-05-20T18:13:58Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。