論文の概要: Fisher-Pitman permutation tests based on nonparametric Poisson mixtures
with application to single cell genomics
- arxiv url: http://arxiv.org/abs/2106.03022v1
- Date: Sun, 6 Jun 2021 03:31:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:23:59.316107
- Title: Fisher-Pitman permutation tests based on nonparametric Poisson mixtures
with application to single cell genomics
- Title(参考訳): 非パラメトリックポアソン混合物を用いたfisher-pitman置換試験と単一細胞ゲノミクスへの応用
- Authors: Zhen Miao, Weihao Kong, Ramya Korlakai Vinayak, Wei Sun, and Fang Han
- Abstract要約: 本稿では,未知の混合分布の等価性を評価するためのフィッシャー・ピットマン型変質試験の理論的および経験的性能について検討する。
混合分布の非パラメトリック最大度推定器(NPMLE)上に構築すると、これらの試験はカウントデータの複雑な不特定構造に適応できることが理論的に示されている。
- 参考スコア(独自算出の注目度): 13.499399537246003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the theoretical and empirical performance of
Fisher-Pitman-type permutation tests for assessing the equality of unknown
Poisson mixture distributions. Building on nonparametric maximum likelihood
estimators (NPMLEs) of the mixing distribution, these tests are theoretically
shown to be able to adapt to complicated unspecified structures of count data
and also consistent against their corresponding ANOVA-type alternatives; the
latter is a result in parallel to classic claims made by Robinson (Robinson,
1973). The studied methods are then applied to a single-cell RNA-seq data
obtained from different cell types from brain samples of autism subjects and
healthy controls; empirically, they unveil genes that are differentially
expressed between autism and control subjects yet are missed using common
tests. For justifying their use, rate optimality of NPMLEs is also established
in settings similar to nonparametric Gaussian (Wu and Yang, 2020a) and binomial
mixtures (Tian et al., 2017; Vinayak et al., 2019).
- Abstract(参考訳): 本稿では,未知ポアソン混合分布の等価性を評価するためのフィッシャー・ピットマン型置換試験の理論的および経験的性能について検討する。
混合分布の非パラメトリック極大推定器(NPMLE)上に構築されたこれらの試験は、理論上はカウントデータの複雑な不特定構造に適応し、対応するANOVA型の代替品と矛盾することが示され、後者はロビンソン(Robinson, 1973)の古典的な主張と平行な結果である。
研究方法は、自閉症の被験者の脳サンプルから得られた異なる細胞型から得られた単一細胞RNA配列データに適用され、実験的に、自閉症とコントロール対象の間で差分に発現する遺伝子が、共通のテストで見逃される。
それらの使用を正当化するために、NPMLEsの速度最適性は非パラメトリックガウス(Wu and Yang, 2020a)や二項混合(Tian et al., 2017; Vinayak et al., 2019)と同様の設定で確立されている。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Causal Inference for Genomic Data with Multiple Heterogeneous Outcomes [1.5845117761091052]
複数の導出結果を持つ2つのロバストな推定のための一般的な半パラメトリックフレームワークを提案する。
分析を標準化された平均処理効果と量子処理効果に専門化する。
論文 参考訳(メタデータ) (2024-04-14T02:07:14Z) - Gaussian Latent Dirichlet Allocation for Discrete Human State Discovery [1.057079240576682]
離散状態発見問題に対する教師なし確率モデルであるGaussian Latent Dirichlet Allocation (GLDA)を提案する。
GLDAは、自然言語処理において人気のあるトピックモデルであるLatent Dirichlet Allocation (LDA)から個々の混合構造を借りている。
両データセットにおいて,GLDAを学習したクラスウェイトは,臨床評価したうつ病,不安,ストレススコアと,ベースラインのGMMよりも有意に高い相関性を示した。
論文 参考訳(メタデータ) (2022-06-28T18:33:46Z) - Sequential Permutation Testing of Random Forest Variable Importance
Measures [68.8204255655161]
そこで本研究では、逐次置換テストと逐次p値推定を用いて、従来の置換テストに関連する高い計算コストを削減することを提案する。
シミュレーション研究の結果、シーケンシャルテストの理論的性質が当てはまることを確認した。
本手法の数値安定性を2つの応用研究で検討した。
論文 参考訳(メタデータ) (2022-06-02T20:16:50Z) - Joint Probability Estimation Using Tensor Decomposition and Dictionaries [3.4720326275851994]
本研究では, 与えられた離散確率と連続確率変数の連立確率の非パラメトリック推定を, それらの(経験的推定)2次元境界値から検討した。
我々は、データを調べて分布の様々なファミリーの辞書を作成し、それを混合した製品の各分解因子を近似するために利用する。
論文 参考訳(メタデータ) (2022-03-03T11:55:51Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Optimal regularizations for data generation with probabilistic graphical
models [0.0]
経験的に、よく調和された正規化スキームは、推論されたモデルの品質を劇的に改善する。
生成的ペアワイドグラフィカルモデルの最大Aポストエリオーリ(MAP)推論におけるL2とL1の正規化について検討する。
論文 参考訳(メタデータ) (2021-12-02T14:45:16Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。