論文の概要: HR-VILAGE-3K3M: A Human Respiratory Viral Immunization Longitudinal Gene Expression Dataset for Systems Immunity
- arxiv url: http://arxiv.org/abs/2505.14725v1
- Date: Mon, 19 May 2025 19:37:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:58.65396
- Title: HR-VILAGE-3K3M: A Human Respiratory Viral Immunization Longitudinal Gene Expression Dataset for Systems Immunity
- Title(参考訳): HR-VilAGE-3K3M : システム免疫のためのヒト呼吸性ウイルス免疫の経時的遺伝子発現データセット
- Authors: Xuejun Sun, Yiran Song, Xiaochen Zhou, Ruilie Cai, Yu Zhang, Xinyi Li, Rui Peng, Jialiu Xie, Yuanyuan Yan, Muyao Tang, Prem Lakshmanane, Baiming Zou, James S. Hagood, Raymond J. Pickles, Didong Li, Fei Zou, Xiaojing Zheng,
- Abstract要約: ヒト呼吸性ウイルス免疫LongitudinAl遺伝子の発現(HR-VilAGE-3K3M)リポジトリは、256万以上の細胞を含む66の被験者3,178名から14,136名のRNA-seqプロファイルを統合している。
HR-VilAGE-3K3Mは、ヒトの呼吸器ウイルス免疫にとって最大の経時的転写産物である。
- 参考スコア(独自算出の注目度): 8.64940622146001
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Respiratory viral infections pose a global health burden, yet the cellular immune responses driving protection or pathology remain unclear. Natural infection cohorts often lack pre-exposure baseline data and structured temporal sampling. In contrast, inoculation and vaccination trials generate insightful longitudinal transcriptomic data. However, the scattering of these datasets across platforms, along with inconsistent metadata and preprocessing procedure, hinders AI-driven discovery. To address these challenges, we developed the Human Respiratory Viral Immunization LongitudinAl Gene Expression (HR-VILAGE-3K3M) repository: an AI-ready, rigorously curated dataset that integrates 14,136 RNA-seq profiles from 3,178 subjects across 66 studies encompassing over 2.56 million cells. Spanning vaccination, inoculation, and mixed exposures, the dataset includes microarray, bulk RNA-seq, and single-cell RNA-seq from whole blood, PBMCs, and nasal swabs, sourced from GEO, ImmPort, and ArrayExpress. We harmonized subject-level metadata, standardized outcome measures, applied unified preprocessing pipelines with rigorous quality control, and aligned all data to official gene symbols. To demonstrate the utility of HR-VILAGE-3K3M, we performed predictive modeling of vaccine responders and evaluated batch-effect correction methods. Beyond these initial demonstrations, it supports diverse systems immunology applications and benchmarking of feature selection and transfer learning algorithms. Its scale and heterogeneity also make it ideal for pretraining foundation models of the human immune response and for advancing multimodal learning frameworks. As the largest longitudinal transcriptomic resource for human respiratory viral immunization, it provides an accessible platform for reproducible AI-driven research, accelerating systems immunology and vaccine development against emerging viral threats.
- Abstract(参考訳): 呼吸器感染症は世界的な健康上の負担をもたらすが、細胞性免疫反応による保護や病理は未だ不明である。
自然感染コホートは、しばしば露出前のベースラインデータと時間的サンプリングを欠いている。
対照的に、接種および接種試験は、洞察に富んだ経時的転写データを生成する。
しかし、これらのデータセットがプラットフォーム全体に分散し、一貫性のないメタデータや前処理手順とともに、AI駆動の発見を妨げる。
これらの課題に対処するため、我々は256万以上の細胞を含む66の被験者3,178人の被験者から14,136人のRNA-seqプロファイルを統合するAI対応で厳格にキュレートされたデータセット、HR-VILAGE-3K3M(Human Respiratory Viral Immunization LongitudinAl Gene Expression)レポジトリを開発した。
ワクチン接種、接種、混合曝露により、このデータセットは、GEO、ImmPort、ArrayExpressから供給された全血液、PBMC、鼻腔スワブからマイクロアレイ、バルクRNA-seq、シングルセルRNA-seqを含む。
被験者レベルのメタデータ、標準化された結果測定、厳密な品質制御による統合前処理パイプラインの適用、および全てのデータを公式な遺伝子記号に整列させる。
HR-VILAGE-3K3Mの有用性を実証するため,ワクチン反応器の予測モデルとバッチ効果補正法の評価を行った。
これらの最初のデモの他に、多様なシステム免疫学応用と特徴選択と伝達学習アルゴリズムのベンチマークをサポートする。
そのスケールと不均一性は、ヒト免疫応答の基礎モデルを事前訓練し、マルチモーダル学習フレームワークを進化させるのにも最適である。
ヒトの呼吸器ウイルス免疫にとって最大の経時的転写産物であり、再現可能なAIによる研究、システム免疫学の加速、新しいウイルスの脅威に対するワクチン開発のためのアクセス可能なプラットフォームを提供する。
関連論文リスト
- Harnessing Preference Optimisation in Protein LMs for Hit Maturation in Cell Therapy [0.5315454965484603]
細胞と免疫療法は、免疫系を調節することにより、がんや自己免疫疾患などの疾患を治療するための形質転換能を提供する。
これらの治療法の開発は資源集約的であり、薬物候補の大多数は実験室での試験以上の進歩に失敗している。
近年の機械学習の進歩は、タンパク質工学などの領域に革命をもたらし、大規模で標準化されたデータセットの不足や細胞系の複雑さにより、免疫療法の応用は制限され続けている。
論文 参考訳(メタデータ) (2024-12-02T11:21:58Z) - Machine Learning-Based Analysis of Ebola Virus' Impact on Gene
Expression in Nonhuman Primates [3.842863644161241]
本研究では,エボラウイルス (EBOV) に感染した非ヒト霊長類 (NHP) から得られた遺伝子発現データを解析するために,機械学習に基づく手法である Supervised Magnitude-Altitude Scoring (SMAS) 手法を提案する。
我々は,エボラ感染NHPのNanoString遺伝子発現プロファイルの包括的データセットを用いて,宿主-病原体間相互作用解析のためのSMASシステムをデプロイした。
IFI6とIFI27を重要なバイオマーカーとして同定し、100%精度で例外的な予測性能を示し、AUC(Area Under the Curve)測定値を用いて様々な段階の分類を行った。
論文 参考訳(メタデータ) (2024-01-16T18:31:23Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning [3.8175773487333857]
本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
論文 参考訳(メタデータ) (2022-11-30T00:13:59Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - COVIDx-US -- An open-access benchmark dataset of ultrasound imaging data
for AI-driven COVID-19 analytics [116.6248556979572]
COVIDx-USは、新型コロナウイルス関連超音波画像データのオープンアクセスベンチマークデータセットです。
肺超音波93本と,SARS-CoV-2肺炎,非SARS-CoV-2肺炎,健康管理症例10,774本からなる。
論文 参考訳(メタデータ) (2021-03-18T03:31:33Z) - Semi-supervised Neural Networks solve an inverse problem for modeling
Covid-19 spread [61.9008166652035]
半教師付きニューラルネットワークを用いた新型コロナウイルスの感染拡大について検討した。
我々は、人口の受動的一部がウイルスの動態から分離されていると仮定する。
論文 参考訳(メタデータ) (2020-10-10T19:33:53Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations [0.0]
このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
論文 参考訳(メタデータ) (2020-08-26T20:20:30Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。