論文の概要: Disentangling Shared and Target-Enriched Topics via Background-Contrastive Non-negative Matrix Factorization
- arxiv url: http://arxiv.org/abs/2602.22387v1
- Date: Wed, 25 Feb 2026 20:34:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.395912
- Title: Disentangling Shared and Target-Enriched Topics via Background-Contrastive Non-negative Matrix Factorization
- Title(参考訳): 背景コントラスト非負行列因子化によるディペンタングリング共有・ターゲットリッチトピックス
- Authors: Yixuan Li, Archer Y. Yang, Yue Li,
- Abstract要約: 背景コントラスト非負行列分解(モデル)を導入する。
モデルは、ターゲットデータセットとマッチした背景を共同で分解することで、ターゲットに富んだ潜在トピックを抽出する。
これは、死後の抑うつ性脳の単一細胞RNA-seqにおける疾患関連プログラムを含む、従来の方法によって明らかにされていないシグナルを明らかにする。
- 参考スコア(独自算出の注目度): 19.996419408387478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biological signals of interest in high-dimensional data are often masked by dominant variation shared across conditions. This variation, arising from baseline biological structure or technical effects, can prevent standard dimensionality reduction methods from resolving condition-specific structure. The challenge is that these confounding topics are often unknown and mixed with biological signals. Existing background correction methods are either unscalable to high dimensions or not interpretable. We introduce background contrastive Non-negative Matrix Factorization (\model), which extracts target-enriched latent topics by jointly factorizing a target dataset and a matched background using shared non-negative bases under a contrastive objective that suppresses background-expressed structure. This approach yields non-negative components that are directly interpretable at the feature level, and explicitly isolates target-specific variation. \model is learned by an efficient multiplicative update algorithm via matrix multiplication such that it is highly efficient on GPU hardware and scalable to big data via minibatch training akin to deep learning approach. Across simulations and diverse biological datasets, \model reveals signals obscured by conventional methods, including disease-associated programs in postmortem depressive brain single-cell RNA-seq, genotype-linked protein expression patterns in mice, treatment-specific transcriptional changes in leukemia, and TP53-dependent drug responses in cancer cell lines.
- Abstract(参考訳): 高次元データに対する生物学的シグナルは、条件間で共有される支配的な変動によって隠蔽されることが多い。
この変異は、ベースラインの生物学的構造や技術的な影響から生じるもので、標準的な次元減少法が条件固有の構造を解消するのを防ぐことができる。
課題は、これらの混在するトピックがしばしば未知であり、生物学的信号と混ざり合っていることである。
既存の背景補正法は、高次元ではスケールできないか、解釈できないかのいずれかである。
我々は,背景表現構造を抑圧する対照的目的の下で,共有された非負の基数を用いて,ターゲットデータセットと一致した背景を共同分解することにより,対象に富んだ潜在トピックを抽出する背景非負の行列因子分解(\model)を導入する。
このアプローチは、機能レベルで直接解釈可能な非負のコンポーネントを生成し、ターゲット固有のバリエーションを明示的に分離する。
\modelは、行列乗算による効率的な乗算的更新アルゴリズムによって学習され、GPUハードウェア上で非常に効率的で、ディープラーニングアプローチに似たミニバッチトレーニングを通じて、ビッグデータにスケーラブルである。
シミュレーションと多様な生物学的データセットを通じて、Shamodelは、死後うつ病脳の単一細胞RNA配列における疾患関連プログラム、マウスにおける遺伝子型関連タンパク質の発現パターン、白血病の治療特異的転写変化、癌細胞株におけるTP53依存的な薬物応答など、従来の方法によって明らかにされていないシグナルを明らかにしている。
関連論文リスト
- scDFM: Distributional Flow Matching Model for Robust Single-Cell Perturbation Prediction [12.48933770510505]
条件付きフローマッチングに基づく生成フレームワークである scDFM を提案する。
scDFMは、細胞レベルでの通信以上の個体群を混乱させ、制御する。
論文 参考訳(メタデータ) (2026-02-06T17:00:21Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - scMEDAL for the interpretable analysis of single-cell transcriptomics data with batch effect visualization using a deep mixed effects autoencoder [3.194381706244149]
単セル混合効果Deep Autoencoder学習フレームワークである scMEDAL を提案する。
scMEDALは2つの補完ワークを使用して、バッチ不変とバッチ固有のエフェクトをモデル化する。
scMEDALは、skMEDAL-FEと確立された修正方法を補完する解釈可能なバッチ固有の埋め込みを生成する。
論文 参考訳(メタデータ) (2024-11-11T00:10:48Z) - Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - Weakly supervised covariance matrices alignment through Stiefel matrices
estimation for MEG applications [64.20396555814513]
本稿では,Mixing Model Stiefel Adaptation (MSA)と呼ばれる時系列データに対する新しいドメイン適応手法を提案する。
我々は、ドメイン間の等価な信号分散とペアの対応を確立することにより、ターゲット領域における豊富なラベルのないデータを利用して効果的な予測を行う。
MSAは、Cam-CANデータセットのMEG信号を用いて、タスクの変動を伴う脳年齢回帰の最近の手法より優れている。
論文 参考訳(メタデータ) (2024-01-24T19:04:49Z) - Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics [44.97217246897902]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs [6.708052194104378]
我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
論文 参考訳(メタデータ) (2022-09-14T15:25:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。