論文の概要: Estimating Higher-Order Mixed Memberships via the $\ell_{2,\infty}$
Tensor Perturbation Bound
- arxiv url: http://arxiv.org/abs/2212.08642v1
- Date: Fri, 16 Dec 2022 18:32:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 16:14:13.338470
- Title: Estimating Higher-Order Mixed Memberships via the $\ell_{2,\infty}$
Tensor Perturbation Bound
- Title(参考訳): $\ell_{2,\infty}$テンソル摂動束による高次混合メンバシップの推定
- Authors: Joshua Agterberg and Anru Zhang
- Abstract要約: テンソルブロックモデルの一般化であるテンソル混合メンバーシップブロックモデルを提案する。
我々は,モデルの同定可能性を確立し,計算効率の良い推定手法を提案する。
2つのフライトデータセットと1つのトレーディングネットワークデータセットへのアプリケーションを含む、実データおよびシミュレーションデータに適用する。
- 参考スコア(独自算出の注目度): 7.6146285961466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Higher-order multiway data is ubiquitous in machine learning and statistics
and often exhibits community-like structures, where each component (node) along
each different mode has a community membership associated with it. In this
paper we propose the tensor mixed-membership blockmodel, a generalization of
the tensor blockmodel positing that memberships need not be discrete, but
instead are convex combinations of latent communities. We establish the
identifiability of our model and propose a computationally efficient estimation
procedure based on the higher-order orthogonal iteration algorithm (HOOI) for
tensor SVD composed with a simplex corner-finding algorithm. We then
demonstrate the consistency of our estimation procedure by providing a per-node
error bound, which showcases the effect of higher-order structures on
estimation accuracy. To prove our consistency result, we develop the
$\ell_{2,\infty}$ tensor perturbation bound for HOOI under independent,
possibly heteroskedastic, subgaussian noise that may be of independent
interest. Our analysis uses a novel leave-one-out construction for the
iterates, and our bounds depend only on spectral properties of the underlying
low-rank tensor under nearly optimal signal-to-noise ratio conditions such that
tensor SVD is computationally feasible. Whereas other leave-one-out analyses
typically focus on sequences constructed by analyzing the output of a given
algorithm with a small part of the noise removed, our leave-one-out analysis
constructions use both the previous iterates and the additional tensor
structure to eliminate a potential additional source of error. Finally, we
apply our methodology to real and simulated data, including applications to two
flight datasets and a trade network dataset, demonstrating some effects not
identifiable from the model with discrete community memberships.
- Abstract(参考訳): 高次のマルチウェイデータは機械学習や統計学においてユビキタスであり、しばしばコミュニティのような構造を示し、それぞれのコンポーネント(ノード)が関連するコミュニティメンバーシップを持つ。
本稿では,テンソル混合メンバシップブロックモデルを提案する。テンソルブロックモデルの一般化は,メンバシップが離散的ではなく,潜在コミュニティの凸結合であることを示す。
我々は,本モデルの同定可能性を確立し,単純なコーナーフィンディングアルゴリズムを用いたテンソルSVDの高次直交反復アルゴリズム(HOOI)に基づく計算効率の高い推定手法を提案する。
次に、高次構造が推定精度に与える影響を示すノード単位の誤差境界を提供することにより、推定手順の整合性を示す。
一貫性を証明するために、HOOI に対する $\ell_{2,\infty}$ tensor 摂動を独立で、おそらくはヘテロスケダティックな亜ガウス雑音の下で、独立に利害を受ける可能性がある。
本解析では,イテレートに対する新しい残余ワンアウト構造を用い,テンソルsvdが計算可能となるような,ほぼ最適信号対雑音比条件下での低ランクテンソルのスペクトル特性のみに依存する。
他の1次解析は通常、ノイズのごく一部を除去したアルゴリズムの出力を解析して構築されるシーケンスに焦点をあてるが、我々の1次解析構成は、前回の反復と追加のテンソル構造の両方を使用して、潜在的な追加的なエラーの原因を取り除く。
最後に,本手法を実データとシミュレーションデータに適用し,2つのフライトデータセットとトレードネットワークデータセットに適用し,個別のコミュニティメンバーシップを持つモデルから特定できない効果を示す。
関連論文リスト
- Learning Unnormalized Statistical Models via Compositional Optimization [73.30514599338407]
実データと人工雑音のロジスティックな損失として目的を定式化することにより, ノイズコントラスト推定(NCE)を提案する。
本稿では,非正規化モデルの負の対数類似度を最適化するための直接的アプローチについて検討する。
論文 参考訳(メタデータ) (2023-06-13T01:18:16Z) - Subspace clustering in high-dimensions: Phase transitions \&
Statistical-to-Computational gap [24.073221004661427]
部分空間クラスタリングを研究するための単純なモデルは、高次元の$k$-ガウス混合モデルである。
広帯域な高次元状態における統計的に最適な再構成誤差を正確に評価する。
論文 参考訳(メタデータ) (2022-05-26T17:47:35Z) - Nonparametric Sparse Tensor Factorization with Hierarchical Gamma
Processes [16.79618682556073]
疎観測テンソルに対する非パラメトリック分解法を提案する。
階層的ガンマ過程とポアソンランダム測度を用いてテンソル値のプロセスを構築する。
効率的な推論のために、有限標本分割、密度変換、ランダム特徴量に対するディリクレ過程特性を用いる。
論文 参考訳(メタデータ) (2021-10-19T16:17:26Z) - Lattice partition recovery with dyadic CART [79.96359947166592]
我々は、$d$次元格子上の加法ガウス雑音によって破損したピースワイド定値信号について検討する。
この形式のデータは、多くのアプリケーションで自然に発生し、統計処理や信号処理の文献において、信号の検出やテスト、ノイズの除去、推定といったタスクが広く研究されている。
本稿では,未知の信号の一貫性領域によって誘導される格子の分割を推定する,分割回復の問題について考察する。
我々は、DCARTベースの手順が、下位分割を$sigma2 k*の順序で一貫して推定することを証明した。
論文 参考訳(メタデータ) (2021-05-27T23:41:01Z) - A Bayesian Approach to Block-Term Tensor Decomposition Model Selection
and Computation [10.91885508254207]
いわゆるブロック項分解(BTD)テンソルモデル(特にランク=(L_r,L_r,1)$バージョン)は近年注目を集めている。
BTDモデル構造、すなわちブロック項の数とその個々のランクを推定するという課題は、最近になって注目され始めたばかりです。
ランク-$(L_r,L_r,1)$ BTDモデルの選択と計算の問題を、列の間隔を直交するアイデアに基づいて解くためのベイズ的アプローチが採られる。
論文 参考訳(メタデータ) (2021-01-08T09:37:21Z) - Stochastic Approximation for Online Tensorial Independent Component
Analysis [98.34292831923335]
独立成分分析(ICA)は統計機械学習や信号処理において一般的な次元削減ツールである。
本稿では,各独立成分を推定する副産物オンライン時系列アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-28T18:52:37Z) - Exact Clustering in Tensor Block Model: Statistical Optimality and
Computational Limit [10.8145995157397]
高階クラスタリングは、マルチウェイデータセットの異種サブ構造を特定することを目的とする。
非計算と問題の性質は統計学と統計学の両方に重大な課題をもたらす。
論文 参考訳(メタデータ) (2020-12-18T00:48:27Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Probabilistic Circuits for Variational Inference in Discrete Graphical
Models [101.28528515775842]
変分法による離散的グラフィカルモデルの推論は困難である。
エビデンス・ロウアーバウンド(ELBO)を推定するためのサンプリングに基づく多くの手法が提案されている。
Sum Product Networks (SPN) のような確率的回路モデルのトラクタビリティを活用する新しい手法を提案する。
選択的SPNが表現的変動分布として適していることを示し、対象モデルの対数密度が重み付けされた場合、対応するELBOを解析的に計算可能であることを示す。
論文 参考訳(メタデータ) (2020-10-22T05:04:38Z) - Multi-View Spectral Clustering Tailored Tensor Low-Rank Representation [105.33409035876691]
本稿では,テンソル低ランクモデルに基づくマルチビュースペクトルクラスタリング(MVSC)の問題について検討する。
MVSCに適合する新しい構造テンソル低ランクノルムを設計する。
提案手法は最先端の手法よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T11:52:12Z) - A Unified Framework for Coupled Tensor Completion [42.19293115131073]
結合テンソル分解は、潜在結合因子に由来する事前知識を組み込むことで、結合データ構造を明らかにする。
TRは強力な表現能力を持ち、いくつかの多次元データ処理アプリケーションで成功している。
提案手法は, 合成データに関する数値実験で検証され, 実世界のデータに対する実験結果は, 回収精度の観点から, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-09T02:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。