論文の概要: Integrated Transcriptomic-proteomic Biomarker Identification for Radiation Response Prediction in Non-small Cell Lung Cancer Cell Lines
- arxiv url: http://arxiv.org/abs/2511.22735v1
- Date: Thu, 27 Nov 2025 20:01:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.702462
- Title: Integrated Transcriptomic-proteomic Biomarker Identification for Radiation Response Prediction in Non-small Cell Lung Cancer Cell Lines
- Title(参考訳): 非小細胞肺癌細胞株の放射線応答予測のための統合的トランスクリプトーム-プロテオミクスバイオマーカー同定
- Authors: Yajun Yu, Guoping Xu, Steve Jiang, Robert Timmerman, John Minna, Yuanyuan Zhang, Hao Peng,
- Abstract要約: 非小細胞肺癌(NSCLC)におけるSF2予測のための初回プロテオトランスクリプトームの枠組み
放射線応答の予測を同時に行うバイオマーカーの同定のための統合トランスクリプトームプロテオームフレームワーク。
独立したパイプラインは、トランスクリプトーム、プロテオミクス、複合データセットから20の優先順位付けされた遺伝子シグネチャを同定した。
- 参考スコア(独自算出の注目度): 7.496897814762568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To develop an integrated transcriptome-proteome framework for identifying concurrent biomarkers predictive of radiation response, as measured by survival fraction at 2 Gy (SF2), in non-small cell lung cancer (NSCLC) cell lines. RNA sequencing (RNA-seq) and data-independent acquisition mass spectrometry (DIA-MS) proteomic data were collected from 73 and 46 NSCLC cell lines, respectively. Following preprocessing, 1,605 shared genes were retained for analysis. Feature selection was performed using least absolute shrinkage and selection operator (Lasso) regression with a frequency-based ranking criterion under five-fold cross-validation repeated ten times. Support vector regression (SVR) models were constructed using transcriptome-only, proteome-only, and combined transcriptome-proteome feature sets. Model performance was assessed by the coefficient of determination (R2) and root mean square error (RMSE). Correlation analyses evaluated concordance between RNA and protein expression and the relationships of selected biomarkers with SF2. RNA-protein expression exhibited significant positive correlations (median Pearson's r = 0.363). Independent pipelines identified 20 prioritized gene signatures from transcriptomic, proteomic, and combined datasets. Models trained on single-omic features achieved limited cross-omic generalizability, while the combined model demonstrated balanced predictive accuracy in both datasets (R2=0.461, RMSE=0.120 for transcriptome; R2=0.604, RMSE=0.111 for proteome). This study presents the first proteotranscriptomic framework for SF2 prediction in NSCLC, highlighting the complementary value of integrating transcriptomic and proteomic data. The identified concurrent biomarkers capture both transcriptional regulation and functional protein activity, offering mechanistic insights and translational potential.
- Abstract(参考訳): 非小細胞肺癌(NSCLC)細胞株において、生存率2Gy(SF2)で測定される放射線応答の同時生マーカーを同定する統合トランスクリプトーム・プロテオームフレームワークを開発する。
RNAシークエンシング (RNA-seq) およびデータ非依存的取得質量分析 (DIA-MS) プロテオミクスデータを, 73NSCLC細胞株と46NSCLC細胞株からそれぞれ収集した。
前処理後、解析のために1,605個の共有遺伝子が保持された。
周波数に基づく格付け基準を10回繰り返した場合,最小絶対収縮・選択演算子(Lasso)回帰を用いて特徴選択を行った。
サポートベクター回帰 (SVR) モデルは, トランスクリプトームのみ, プロテオームのみ, およびトランスクリプトーム-プロテオームの組み合わせを用いて構築された。
モデル性能は決定係数(R2)と根平均二乗誤差(RMSE)で評価した。
RNAとタンパク質発現の一致と選択バイオマーカーのSF2との相関解析
RNA蛋白の発現には有意な正の相関が認められた(ミディアム・ピアソンのr = 0.363)。
独立したパイプラインは、トランスクリプトーム、プロテオミクス、複合データセットから20の優先順位付けされた遺伝子シグネチャを同定した。
単一オーミックな特徴を訓練したモデルではクロスオーミックな一般化性が制限され、組み合わせたモデルは両方のデータセットでバランスの取れた予測精度を示した(R2=0.461, RMSE=0.120, R2=0.604, RMSE=0.111, Proteome)。
本研究は,NSCLCにおけるSF2予測のための最初のプロテオトランスクリプトームフレームワークを示し,トランスクリプトームとプロテオミックデータの統合の相補的価値を強調した。
同定された生体マーカーは転写調節と機能的タンパク質活性の両方を捉え、機械的な洞察と翻訳の可能性を提供する。
関連論文リスト
- Transforming Multi-Omics Integration with GANs: Applications in Alzheimer's and Cancer [0.0]
我々は,高品質な合成マルチオミクスプロファイルを生成するために,GAN(Generative Adversarial Network)ベースのフレームワークであるOmics-GANを紹介する。
アルツハイマー病に対するROSMAPコホートを用いた3種類のオミクス(mRNA,メチル化,DNAメチル化)に対するOmics-GANの試験を行った。
5倍のクロスバリデーションを繰り返したサポートベクターマシン(SVM)は、元のオミクスプロファイルと比較して予測精度を向上した。
Boxplot分析では、合成データはノイズや外れ値を低減しつつ統計分布を保存していることを確認した。
論文 参考訳(メタデータ) (2025-10-22T05:55:49Z) - scPPDM: A Diffusion Model for Single-Cell Drug-Response Prediction [44.96130504547205]
本稿では,ScRNA-seqデータから単一セルの薬物応答予測を行う最初の拡散型フレームワークであるScPPDMを紹介する。
scPPDMは、非結合性GD-Attnを介して一貫した潜伏空間に、摂動前状態と投与量のある薬物の2つの条件チャネルを結合する。
論文 参考訳(メタデータ) (2025-10-08T16:17:39Z) - LGE-Guided Cross-Modality Contrastive Learning for Gadolinium-Free Cardiomyopathy Screening in Cine CMR [51.11296719862485]
CMRを用いたガドリニウムフリー心筋症スクリーニングのためのコントラシブラーニングおよびクロスモーダルアライメントフレームワークを提案する。
CMRとLate Gadolinium Enhancement (LGE) 配列の潜伏空間を整列させることにより, 本モデルでは線維症特異的な病理組織をCMR埋め込みにエンコードする。
論文 参考訳(メタデータ) (2025-08-23T07:21:23Z) - Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - scMamba: A Pre-Trained Model for Single-Nucleus RNA Sequencing Analysis in Neurodegenerative Disorders [43.24785083027205]
scMambaは、snRNA-seq解析の品質と実用性を改善するために設計された事前訓練モデルである。
最近のMambaモデルにインスパイアされた scMamba は、線形アダプタ層、遺伝子埋め込み、双方向のMambaブロックを組み込んだ新しいアーキテクチャを導入している。
scMambaは、セルタイプアノテーション、ダブルト検出、インプット、差分表現された遺伝子の同定など、様々な下流タスクにおいて、ベンチマーク手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-02-12T11:48:22Z) - Graph Structure Learning for Tumor Microenvironment with Cell Type Annotation from non-spatial scRNA-seq data [6.432270457083369]
本稿では,細胞型予測と細胞間相互作用解析を強化する新しいグラフニューラルネットワーク(GNN)モデルを提案する。
提案したScGSLモデルは堅牢な性能を示し、平均精度84.83%、精度86.23%、リコール81.51%、F1スコア80.92%を全データセットで達成した。
論文 参考訳(メタデータ) (2025-02-04T18:28:25Z) - Diffusion Model with Representation Alignment for Protein Inverse Folding [53.139837825588614]
タンパク質逆フォールディングはバイオインフォマティクスの基本的な問題であり、与えられたタンパク質のバックボーン構造からアミノ酸配列を復元することを目的としている。
表現アライメント(DMRA)を用いた拡散モデルを用いた新しい手法を提案する。
実験では,CATH4.2データセットを広範囲に評価し,DMRAが先行手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-12-12T15:47:59Z) - Integrating Protein Sequence and Expression Level to Analysis Molecular Characterization of Breast Cancer Subtypes [0.0]
本研究の目的は、乳癌のサブタイプの分子的特徴を改善するために、タンパク質配列データと発現レベルを統合することである。
タンパク質配列に特化して設計された言語モデルであるProtGPT2を用いて,タンパク質の機能的および構造的特性を捉えた埋め込みを生成する。
これらの埋め込みはタンパク質の発現レベルと統合され、強化された生物学的表現を形成し、機械学習を用いて分析した。
論文 参考訳(メタデータ) (2024-10-02T17:05:48Z) - hist2RNA: An efficient deep learning architecture to predict gene
expression from breast cancer histopathology images [11.822321981275232]
深層学習アルゴリズムは、デジタル病理画像中の形態パターンを効果的に抽出し、分子の表現型を迅速かつ低コストで予測することができる。
我々は,138遺伝子の発現を予測するために,バルクRNAシークエンシング技術にインスパイアされたhist2RNAという新しい計算効率の高い手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T10:54:32Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Predicting Molecular Phenotypes with Single Cell RNA Sequencing Data: an
Assessment of Unsupervised Machine Learning Models [0.0]
本研究は、異種腫瘍における治療抵抗性表現型分類における教師なし機械学習の評価である。
scRNAseqは細胞のmRNAを定量化し、細胞表現型を特徴づける。
このパイプラインから生成されたクラスターは、がん細胞の挙動と悪性成長を理解するために使用できる。
論文 参考訳(メタデータ) (2021-08-11T05:30:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。