Fugu-MT 論文翻訳(概要): Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets

論文の概要: Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets

arxiv url: http://arxiv.org/abs/2603.08062v1
Date: Mon, 09 Mar 2026 07:55:32 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-10 15:13:15.634298
Title: Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets
Title（参考訳）: 対立ドメイン適応は不均一RNA-Seqデータセット間の知識伝達を可能にする
Authors: Kevin Dradjat, Massinissa Hamidi, Blaise Hanczar,
Abstract要約: ディープラーニングモデルは、古典的な機械学習アプローチを上回る可能性を示している。転写学では、そのようなデータセットは頻繁に制限され、過度に適合し、一般化が不十分になる。本稿では,大規模な汎用データセットから,がんタイプ分類のためのより小さなデータセットへの効果的な知識伝達を可能にする,ディープラーニングに基づくドメイン適応フレームワークを提案する。
参考スコア（独自算出の注目度）: 2.0755366440393743
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Accurate phenotype prediction from RNA sequencing (RNA-seq) data is essential for diagnosis, biomarker discovery, and personalized medicine. Deep learning models have demonstrated strong potential to outperform classical machine learning approaches, but their performance relies on large, well-annotated datasets. In transcriptomics, such datasets are frequently limited, leading to over-fitting and poor generalization. Knowledge transfer from larger, more general datasets can alleviate this issue. However, transferring information across RNA-seq datasets remains challenging due to heterogeneous preprocessing pipelines and differences in target phenotypes. In this study, we propose a deep learning-based domain adaptation framework that enables effective knowledge transfer from a large general dataset to a smaller one for cancer type classification. The method learns a domain-invariant latent space by jointly optimizing classification and domain alignment objectives. To ensure stable training and robustness in data-scarce scenarios, the framework is trained with an adversarial approach with appropriate regularization. Both supervised and unsupervised approach variants are explored, leveraging labeled or unlabeled target samples. The framework is evaluated on three large-scale transcriptomic datasets (TCGA, ARCHS4, GTEx) to assess its ability to transfer knowledge across cohorts. Experimental results demonstrate consistent improvements in cancer and tissue type classification accuracy compared to non-adaptive baselines, particularly in low-data scenarios. Overall, this work highlights domain adaptation as a powerful strategy for data-efficient knowledge transfer in transcriptomics, enabling robust phenotype prediction under constrained data conditions.
Abstract（参考訳）: RNAシークエンシング(RNA-seq)データからの正確な表現型予測は、診断、バイオマーカー発見、パーソナライズド医療に不可欠である。ディープラーニングモデルは、古典的な機械学習アプローチよりも優れた可能性を強く示していますが、そのパフォーマンスは、大きく、よく注釈付けされたデータセットに依存しています。転写学では、そのようなデータセットは頻繁に制限され、過度に適合し、一般化が不十分になる。より大規模で一般的なデータセットからの知識伝達は、この問題を軽減することができる。しかし、RNA-seqデータセット間で情報を転送することは、不均一な前処理パイプラインとターゲット表現型の違いのため、依然として困難である。本研究では,大規模な一般データセットから癌型分類のためのより小さなデータセットへの効果的な知識伝達を可能にする,ディープラーニングに基づくドメイン適応フレームワークを提案する。この方法は、分類とドメインアライメントの目的を協調的に最適化することで、ドメイン不変の潜在空間を学習する。データスカースシナリオにおける安定したトレーニングと堅牢性を確保するため、フレームワークは適切な正規化を伴う敵のアプローチでトレーニングされる。教師なしアプローチと教師なしアプローチの両方を探索し、ラベル付きまたはラベルなしターゲットサンプルを活用する。このフレームワークは3つの大規模転写データセット(TCGA、ARCHS4、GTEx)で評価され、コホート間で知識を伝達する能力を評価する。実験の結果,特に低データシナリオにおいて,非適応的ベースラインに比べて癌や組織型分類の精度が一貫した改善が見られた。全体として、この研究は、転写学におけるデータ効率のよい知識伝達のための強力な戦略としてのドメイン適応を強調し、制約されたデータ条件下で堅牢な表現型予測を可能にする。

論文の概要: Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets

関連論文リスト