論文の概要: Zero-Truncated Poisson Regression for Sparse Multiway Count Data
Corrupted by False Zeros
- arxiv url: http://arxiv.org/abs/2201.10014v2
- Date: Wed, 12 Apr 2023 00:02:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 19:22:11.401767
- Title: Zero-Truncated Poisson Regression for Sparse Multiway Count Data
Corrupted by False Zeros
- Title(参考訳): 偽零点によるスパースマルチウェイカウントデータに対するゼロトランク付きポアソン回帰
- Authors: Oscar L\'opez, Daniel M. Dunlavy, Richard B. Lehoucq
- Abstract要約: 提案手法は, 偽零点によって破損したマルチウェイカウントデータに対する新しい統計的推論手法を提案する。
我々のアプローチはポアソン分布をゼロに切り換えてすべてのゼロ値を無視している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel statistical inference methodology for multiway count data
that is corrupted by false zeros that are indistinguishable from true zero
counts. Our approach consists of zero-truncating the Poisson distribution to
neglect all zero values. This simple truncated approach dispenses with the need
to distinguish between true and false zero counts and reduces the amount of
data to be processed. Inference is accomplished via tensor completion that
imposes low-rank tensor structure on the Poisson parameter space.
Our main result shows that an $N$-way rank-$R$ parametric tensor
$\boldsymbol{\mathscr{M}}\in(0,\infty)^{I\times \cdots\times I}$ generating
Poisson observations can be accurately estimated by zero-truncated Poisson
regression from approximately $IR^2\log_2^2(I)$ non-zero counts under the
nonnegative canonical polyadic decomposition. Our result also quantifies the
error made by zero-truncating the Poisson distribution when the parameter is
uniformly bounded from below. Therefore, under a low-rank multiparameter model,
we propose an implementable approach guaranteed to achieve accurate regression
in under-determined scenarios with substantial corruption by false zeros.
Several numerical experiments are presented to explore the theoretical results.
- Abstract(参考訳): 本稿では,真のゼロカウントとは区別がつかない偽の零点によって崩壊する多元数データに対する新しい統計的推論手法を提案する。
我々のアプローチはポアソン分布をゼロに切り換えてすべてのゼロ値を無視している。
この単純な切り詰められたアプローチは、真と偽のゼロカウントを区別する必要がなく、処理されるデータの量を減らす。
推論はポアソンパラメータ空間に低ランクテンソル構造を課すテンソル完全性によって達成される。
我々の主な結果は、N$-way rank-$R$ parametric tensor $\boldsymbol{\mathscr{M}}\in(0,\infty)^{I\times \cdots\times I}$$ Poisson observedを、約$IR^2\log_2^2(I)$ non-zero countsの非負の正準ポリアディック分解によるゼロトランカクテッドポアソン回帰によって正確に推定できることを示している。
また,パラメータが下から一様に有界である場合,ポアソン分布をゼロトラッピングすることで得られる誤差を定量化する。
そこで, 低ランクマルチパラメータモデルを用いて, 偽零点による実質的破損を伴う未決定シナリオにおいて, 精度の高い回帰を実現するための実装可能な手法を提案する。
理論的な結果を調べるためにいくつかの数値実験が行われた。
関連論文リスト
- Data subsampling for Poisson regression with pth-root-link [53.63838219437508]
ポアソン回帰のためのデータサブサンプリング手法を開発し解析する。
特に,ポアソン一般化線形モデルと ID-および平方根リンク関数について考察する。
論文 参考訳(メタデータ) (2024-10-30T10:09:05Z) - Negative Binomial Matrix Completion [5.5415918072761805]
行列補完は、行列の欠落や不完全情報を回復することに焦点を当てる。
近位降下勾配によって解ける核ノルム正規化モデルを提案することにより,NB行列の完備化を提案する。
実験では,NBモデルがポアソン行列の完成度を様々なノイズで上回り,実際のデータに対するデータ設定の欠如を実証した。
論文 参考訳(メタデータ) (2024-08-28T19:43:48Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - Robust Sparse Mean Estimation via Incremental Learning [15.536082641659423]
そこで本研究では, 部分的に破損したサンプルの集合から, k$-sparse平均を推定することを目的とする, 頑健な平均推定問題について検討する。
両課題を適度な条件下で克服する簡易平均推定器を提案する。
私たちのメソッドは、スパーシティレベル$k$に関する事前の知識を必要としない。
論文 参考訳(メタデータ) (2023-05-24T16:02:28Z) - A Law of Robustness beyond Isoperimetry [84.33752026418045]
我々は、任意の分布上でニューラルネットワークパラメータを補間する頑健性の低い$Omega(sqrtn/p)$を証明した。
次に、$n=mathrmpoly(d)$のとき、スムーズなデータに対する過度なパラメータ化の利点を示す。
我々は、$n=exp(omega(d))$ のとき、$O(1)$-Lipschitz の頑健な補間関数の存在を否定する。
論文 参考訳(メタデータ) (2022-02-23T16:10:23Z) - Consistent Estimation for PCA and Sparse Regression with Oblivious
Outliers [13.244654316770815]
我々は効率よく計算可能で一貫した推定器を設計する機械を開発する。
スパース回帰では、最適なサンプルサイズ$ngsim (klog d)/alpha2$の整合性を達成する。
PCAの文脈では、パラメータ行列上の広いスパイキネス仮定の下で最適な誤差を保証する。
論文 参考訳(メタデータ) (2021-11-04T15:59:44Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - Outlier-robust sparse/low-rank least-squares regression and robust
matrix completion [1.0878040851637998]
ヘテロジニアス雑音を伴う統計的学習フレームワークにおける高次元最小二乗回帰について検討する。
また, 製品プロセスの新たな応用に基づいて, 行列分解を伴う新しいトレーサリグレス理論を提案する。
論文 参考訳(メタデータ) (2020-12-12T07:42:47Z) - Online Robust Regression via SGD on the l1 loss [19.087335681007477]
ストリーミング方式でデータにアクセス可能なオンライン環境において、ロバストな線形回帰問題を考察する。
この研究で、$ell_O( 1 / (1 - eta)2 n )$損失の降下は、汚染された測定値に依存しない$tildeO( 1 / (1 - eta)2 n )$レートで真のパラメータベクトルに収束することを示した。
論文 参考訳(メタデータ) (2020-07-01T11:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。