論文の概要: Inferences on Mixing Probabilities and Ranking in Mixed-Membership
Models
- arxiv url: http://arxiv.org/abs/2308.14988v1
- Date: Tue, 29 Aug 2023 02:35:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 15:58:50.441548
- Title: Inferences on Mixing Probabilities and Ranking in Mixed-Membership
Models
- Title(参考訳): 混合ミーバーシップモデルにおける混合確率とランキングの推定
- Authors: Sohom Bhattacharya, Jianqing Fan, Jikai Hou
- Abstract要約: ネットワークデータは、経済や健康ネットワークを含む多くのビッグデータアプリケーションで広く利用されている。
本稿では,Degree-Corrected Mixed Membership (DCMM)モデルを用いてネットワークをモデル化する。
我々は、$boldsymbolpi_i(k)$sに対して、メンバシップ混合確率と他の関連する集団量の分布と信頼区間を得られるような、新しい有限サンプル展開を導出する。
- 参考スコア(独自算出の注目度): 5.992878098797828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Network data is prevalent in numerous big data applications including
economics and health networks where it is of prime importance to understand the
latent structure of network. In this paper, we model the network using the
Degree-Corrected Mixed Membership (DCMM) model. In DCMM model, for each node
$i$, there exists a membership vector $\boldsymbol{\pi}_ i =
(\boldsymbol{\pi}_i(1), \boldsymbol{\pi}_i(2),\ldots, \boldsymbol{\pi}_i(K))$,
where $\boldsymbol{\pi}_i(k)$ denotes the weight that node $i$ puts in
community $k$. We derive novel finite-sample expansion for the
$\boldsymbol{\pi}_i(k)$s which allows us to obtain asymptotic distributions and
confidence interval of the membership mixing probabilities and other related
population quantities. This fills an important gap on uncertainty
quantification on the membership profile. We further develop a ranking scheme
of the vertices based on the membership mixing probabilities on certain
communities and perform relevant statistical inferences. A multiplier bootstrap
method is proposed for ranking inference of individual member's profile with
respect to a given community. The validity of our theoretical results is
further demonstrated by via numerical experiments in both real and synthetic
data examples.
- Abstract(参考訳): ネットワークデータは、ネットワークの潜伏構造を理解することが最も重要な経済や保健ネットワークを含む多くのビッグデータアプリケーションで広く利用されている。
本稿では,Degree-Corrected Mixed Membership (DCMM)モデルを用いてネットワークをモデル化する。
dcmmモデルでは、各ノード $i$ に対して、会員ベクトル $\boldsymbol{\pi}_i = (\boldsymbol{\pi}_i(1), \boldsymbol{\pi}_i(2),\ldots, \boldsymbol{\pi}_i(k))$ が存在し、ここで$\boldsymbol{\pi}_i(k)$ は、ノード $i$ がコミュニティ $k$ に与える重みを表す。
我々は$\boldsymbol{\pi}_i(k)$s に対する新しい有限サンプル展開を導出し、会員混合確率および他の関連する集団量の漸近分布と信頼区間を得ることができる。
これは会員プロファイルの不確実性定量化に関する重要なギャップを埋める。
さらに,特定のコミュニティにおける会員混合確率に基づく頂点のランク付け手法を開発し,関連する統計的推測を行う。
マルチプライヤブートストラップ法は,特定のコミュニティに対する個々のメンバのプロファイルのランク付けのために提案されている。
さらに, 実データと合成データの両方で数値実験を行い, 理論的結果の有効性を実証した。
関連論文リスト
- Biology-inspired joint distribution neurons based on Hierarchical Correlation Reconstruction allowing for multidirectional neural networks [0.49728186750345144]
HCRを用いた新しい人工ニューロン(階層的相関再構成)
ネットワークはまた $rho(y,z|x) のような確率分布(ジョイント)を伝播することもできる。
論文 参考訳(メタデータ) (2024-05-08T14:49:27Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - CARD: Classification and Regression Diffusion Models [51.0421331214229]
本稿では,条件生成モデルと事前学習条件平均推定器を組み合わせた分類と回帰拡散(CARD)モデルを提案する。
おもちゃの例と実世界のデータセットを用いて条件分布予測におけるCARDの卓越した能力を示す。
論文 参考訳(メタデータ) (2022-06-15T03:30:38Z) - Learning the Structure of Large Networked Systems Obeying Conservation
Laws [5.86054250638667]
ネットワーク系における保存法則は、$X = B* Y$という形のバランス方程式としてモデル化することができる。
いくつかの実用的なシステムでは、ネットワーク構造はよく知られておらず、データから推定する必要がある。
高次元状態におけるこの問題に対する新たな$ell_1$-regularized maximum max 推定器を提案する。
論文 参考訳(メタデータ) (2022-06-14T18:16:52Z) - Causal Inference Despite Limited Global Confounding via Mixture Models [4.721845865189578]
そのようなモデルの有限$k$-mixtureは、図式的により大きなグラフで表される。
空でないDAGの混合を学習するための最初のアルゴリズムを与える。
論文 参考訳(メタデータ) (2021-12-22T01:04:50Z) - GFlowNet Foundations [66.69854262276391]
Generative Flow Networks (GFlowNets) は、多様な候補をアクティブな学習コンテキストでサンプリングする方法として導入された。
GFlowNetのさらなる理論的性質について述べる。
論文 参考訳(メタデータ) (2021-11-17T17:59:54Z) - Reward-Free Model-Based Reinforcement Learning with Linear Function
Approximation [92.99933928528797]
エピソードマルコフ決定過程(MDP)に対する線形関数近似を用いたモデルに基づく無報酬強化学習について検討する。
計画段階では、特定の報酬関数が与えられ、探索フェーズから収集したサンプルを使用して良い政策を学ぶ。
任意の報酬関数に対して$epsilon$-optimal Policyを得るには,最大$tilde O(H4d(H + d)epsilon-2)$ episodesをサンプリングする必要がある。
論文 参考訳(メタデータ) (2021-10-12T23:03:58Z) - Robust Model Selection and Nearly-Proper Learning for GMMs [26.388358539260473]
学習理論では、データは有限混合モデルから生成されるという標準的な仮定がある。しかし、コンポーネントの数が事前に分かっていないときに何が起こるのか。
対数係数内の分布に適合するために必要な最小コンポーネント数を、およそ決定することができる。
論文 参考訳(メタデータ) (2021-06-05T01:58:40Z) - Adjusted chi-square test for degree-corrected block models [13.122543280692641]
次数補正ブロックモデル(DCSBM)の適合性テストを提案する。
単純な調整により、$d_i$ の調和平均が無限に成長する限り、統計は null の下で分布に収束する。
我々の分布結果は漸近的ではなく、明示的な定数を持ち、目標分布へのコルモゴロフ-スミルノフ距離の有限サンプル境界を与える。
論文 参考訳(メタデータ) (2020-12-30T05:20:59Z) - Neural Bayes: A Generic Parameterization Method for Unsupervised
Representation Learning [175.34232468746245]
本稿ではニューラルベイズと呼ばれるパラメータ化手法を提案する。
これは一般に計算が難しい統計量の計算を可能にする。
このパラメータ化のための2つの独立したユースケースを示す。
論文 参考訳(メタデータ) (2020-02-20T22:28:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。