論文の概要: Robust Bayesian Tensor Factorization with Zero-Inflated Poisson Model
and Consensus Aggregation
- arxiv url: http://arxiv.org/abs/2308.08060v1
- Date: Tue, 15 Aug 2023 22:25:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 15:22:32.540413
- Title: Robust Bayesian Tensor Factorization with Zero-Inflated Poisson Model
and Consensus Aggregation
- Title(参考訳): ゼロ膨張ポアソンモデルを用いたロバストベイズテンソル因子分解とコンセンサス集計
- Authors: Daniel Chafamo, Vignesh Shanmugam, Neriman Tokcan
- Abstract要約: ゼロインフレドポアソン因子化 (Zero Inflated Poisson Factorization, C-ZIPTF) は, 零点を超越した高次元カウントデータの因子化のための新しい手法である。
C-ZIPTFは、ゼロインフレーションデータに対する精度の観点から、ベースライン行列と分解法を一貫して上回る。
C-ZIPTFは分解の一貫性と精度を著しく向上させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Tensor factorizations (TF) are powerful tools for the efficient
representation and analysis of multidimensional data. However, classic TF
methods based on maximum likelihood estimation underperform when applied to
zero-inflated count data, such as single-cell RNA sequencing (scRNA-seq) data.
Additionally, the stochasticity inherent in TFs results in factors that vary
across repeated runs, making interpretation and reproducibility of the results
challenging. In this paper, we introduce Zero Inflated Poisson Tensor
Factorization (ZIPTF), a novel approach for the factorization of
high-dimensional count data with excess zeros. To address the challenge of
stochasticity, we introduce Consensus Zero Inflated Poisson Tensor
Factorization (C-ZIPTF), which combines ZIPTF with a consensus-based
meta-analysis. We evaluate our proposed ZIPTF and C-ZIPTF on synthetic
zero-inflated count data and synthetic and real scRNA-seq data. ZIPTF
consistently outperforms baseline matrix and tensor factorization methods in
terms of reconstruction accuracy for zero-inflated data. When the probability
of excess zeros is high, ZIPTF achieves up to $2.4\times$ better accuracy.
Additionally, C-ZIPTF significantly improves the consistency and accuracy of
the factorization. When tested on both synthetic and real scRNA-seq data, ZIPTF
and C-ZIPTF consistently recover known and biologically meaningful gene
expression programs.
- Abstract(参考訳): テンソル分解(TF)は多次元データの効率的な表現と解析のための強力なツールである。
しかし、単一セルRNAシークエンシング(scRNA-seq)データなどのゼロインフレーションカウントデータに適用した場合、最大推定値に基づく古典的なTF法は、性能が低い。
さらに、TFに固有の確率性は、繰り返し実行毎に異なる要因をもたらし、結果の解釈と再現性が困難になる。
本稿では,過剰な零点を持つ高次元カウントデータの因子分解に対する新しいアプローチである,ゼロ膨張ポアソンテンソル因子分解(ziptf)を提案する。
確率性の課題を解決するために,ZIPTFと合意に基づくメタ分析を組み合わせたConsensus Zero Inflated Poisson Tensor Factorization (C-ZIPTF)を導入する。
提案したZIPTFとC-ZIPTFを合成ゼロインフレーションカウントデータと合成および実scRNA-seqデータに基づいて評価した。
ZIPTFは、ゼロインフレドデータの再構成精度の観点から、ベースライン行列とテンソル分解法を一貫して上回る。
余剰ゼロの確率が高い場合、ZIPTFは最大2.4\times$より精度が良い。
さらに、C-ZIPTFは分解の一貫性と精度を大幅に改善する。
合成および実scRNA-seqデータの両方で試験すると、ZIPTFとC-ZIPTFは、既知の生物学的に意味のある遺伝子発現プログラムを一貫して回復する。
関連論文リスト
- Byzantine-resilient Federated Learning With Adaptivity to Data Heterogeneity [54.145730036889496]
本稿では、ビザンツの悪意ある攻撃データの存在下でのグラディエント・ラーニング(FL)を扱う。
Average Algorithm (RAGA) が提案され、ロバストネスアグリゲーションを活用してデータセットを選択することができる。
論文 参考訳(メタデータ) (2024-03-20T08:15:08Z) - Latent Bottlenecked Attentive Neural Processes [71.18817592128207]
LBANP(Latent Bottlenecked Attentive Neural Processs)について
LBANPは、コンテキストデータポイントの数によらず、クエリ処理の複雑さを持つ。
LBANPは,メタ回帰,画像補完,コンテキスト的マルチアームバンディットに関する最先端技術と競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2022-11-15T19:21:41Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z) - Augmented Tensor Decomposition with Stochastic Optimization [46.16865811396394]
実世界のテンソルデータは、通常高次で、数百万から数十億のエントリを持つ大きな次元を持つ。
テンソル全体を従来のアルゴリズムで分解するのは高価である。
本稿では、データ拡張を効果的に取り入れて下流の分類を向上する拡張テンソル分解を提案する。
論文 参考訳(メタデータ) (2021-06-15T06:29:05Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - Scaling and Scalability: Provable Nonconvex Low-Rank Tensor Estimation
from Incomplete Measurements [30.395874385570007]
基本的な課題は、高度に不完全な測定からテンソルを忠実に回収することである。
タッカー分解におけるテンソル因子を直接回復するアルゴリズムを開発した。
2つの正準問題に対する基底真理テンソルの線形独立率で確実に収束することを示す。
論文 参考訳(メタデータ) (2021-04-29T17:44:49Z) - Deep Transformer Networks for Time Series Classification: The NPP Safety
Case [59.20947681019466]
時間依存nppシミュレーションデータをモデル化するために、教師付き学習方法でトランスフォーマと呼ばれる高度なテンポラルニューラルネットワークを使用する。
トランスはシーケンシャルデータの特性を学習し、テストデータセット上で約99%の分類精度で有望な性能が得られる。
論文 参考訳(メタデータ) (2021-04-09T14:26:25Z) - Online nonnegative CP-dictionary learning for Markovian data [8.490619842547739]
CANDECOMP/PARAFACベースを一般的な制約下でテンソル値データの所定のストリームから学習する新しいアルゴリズムを提案する。
提案アルゴリズムは,データテンソルの列が基礎となるマルコフ連鎖によって生成されるという仮説の下で,目的関数の定常点の集合にほぼ確実に収束することを示す。
論文 参考訳(メタデータ) (2020-09-16T11:41:01Z) - Provable Online CP/PARAFAC Decomposition of a Structured Tensor via
Dictionary Learning [18.464203215845373]
構造化3変量テンソルをその構成的ポリアディック(CP)因子に分解する問題を考察する。
我々は、構造化テンソル因子分解のための証明可能なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-06-30T00:31:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。