論文の概要: Hypothesis Testing for High-Dimensional Matrix-Valued Data
- arxiv url: http://arxiv.org/abs/2412.07987v1
- Date: Tue, 10 Dec 2024 23:59:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:01:31.513532
- Title: Hypothesis Testing for High-Dimensional Matrix-Valued Data
- Title(参考訳): 高次元行列値データの仮説検証
- Authors: Shijie Cui, Danning Li, Runze Li, Lingzhou Xue,
- Abstract要約: 低次元行列のランクテストとして機能するクラッグ (1997) によって提案された最小離散性試験について検討する。
これらの課題に対処するため、我々は高次元行列ランクテストに適した新しいテスト統計法を提案する。
本研究は,本手法の実用性を実証したシミュレーション研究と,監視ビデオデータに関する2つの事例研究で締めくくった。
- 参考スコア(独自算出の注目度): 7.622217735434662
- License:
- Abstract: This paper addresses hypothesis testing for the mean of matrix-valued data in high-dimensional settings. We investigate the minimum discrepancy test, originally proposed by Cragg (1997), which serves as a rank test for lower-dimensional matrices. We evaluate the performance of this test as the matrix dimensions increase proportionally with the sample size, and identify its limitations when matrix dimensions significantly exceed the sample size. To address these challenges, we propose a new test statistic tailored for high-dimensional matrix rank testing. The oracle version of this statistic is analyzed to highlight its theoretical properties. Additionally, we develop a novel approach for constructing a sparse singular value decomposition (SVD) estimator for singular vectors, providing a comprehensive examination of its theoretical aspects. Using the sparse SVD estimator, we explore the properties of the sample version of our proposed statistic. The paper concludes with simulation studies and two case studies involving surveillance video data, demonstrating the practical utility of our proposed methods.
- Abstract(参考訳): 本稿では,行列値データの平均値に関する仮説検証を高次元設定で行う。
低次元行列のランクテストとして機能するクラッグ (1997) によって提案された最小離散性試験について検討する。
本研究では, 試料径に比例して行列次元が増大するにつれて, 本試験の性能を評価するとともに, 試料径を著しく超えた場合の限界を同定する。
これらの課題に対処するため、我々は高次元行列ランクテストに適した新しいテスト統計法を提案する。
この統計学のオラクル版は、その理論的性質を強調するために分析される。
さらに、特異ベクトルに対するスパース特異値分解(SVD)推定器を構築するための新しい手法を開発し、その理論的側面を包括的に検証する。
スパースSVD推定器を用いて,提案した統計量のサンプルバージョンの特性について検討する。
本研究は,本手法の実用性を実証したシミュレーション研究と,監視ビデオデータに関する2つの事例研究で締めくくった。
関連論文リスト
- Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Statistical Inference For Noisy Matrix Completion Incorporating Auxiliary Information [3.9748528039819977]
本稿では,半教師付きモデルにおける雑音行列補完の統計的推測について検討する。
検討した文脈において,反復最小二乗(LS)推定手法を適用した。
提案手法は数回の反復しか必要とせず、結果として得られる低ランク行列と係数行列のエントリーワイズ推定器は正規分布を持つことが保証されている。
論文 参考訳(メタデータ) (2024-03-22T01:06:36Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - A Generalized Latent Factor Model Approach to Mixed-data Matrix
Completion with Entrywise Consistency [3.299672391663527]
マトリックスコンプリート(Matrix completion)は、部分的に観察された行列における欠落したエントリの予測に関する機械学習手法のクラスである。
非線型因子モデルの一般族の下での低ランク行列推定問題として定式化する。
低ランク行列を推定するためのエントリーワイドな一貫した推定器を提案する。
論文 参考訳(メタデータ) (2022-11-17T00:24:47Z) - Optimal Discriminant Analysis in High-Dimensional Latent Factor Models [1.4213973379473654]
高次元分類問題において、一般的に用いられるアプローチは、まず高次元の特徴を低次元空間に射影することである。
我々は、この2段階の手順を正当化するために、隠れた低次元構造を持つ潜在変数モデルを定式化する。
観測された特徴の特定の主成分(PC)を射影とする計算効率の良い分類器を提案する。
論文 参考訳(メタデータ) (2022-10-23T21:45:53Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Estimating Graph Dimension with Cross-validated Eigenvalues [5.0013150536632995]
応用統計学では、潜在次元の数を推定したり、クラスターの数を推定することは基本的な問題であり、繰り返し発生する問題である。
この問題に対するクロスバリデーションな固有値アプローチを提供する。
我々の手順は、すべての$k$次元を推定できるシナリオにおいて、一貫して$k$を推定することを証明する。
論文 参考訳(メタデータ) (2021-08-06T23:52:30Z) - Generalized Multivariate Signs for Nonparametric Hypothesis Testing in
High Dimensions [4.24243593213882]
一般化符号を用いたテストは、名目上のI型エラー率を維持しつつ、既存のテストよりも高い出力を示すことを示す。
MNIST と Minnesota Twin Studies のゲノムデータの例を示す。
論文 参考訳(メタデータ) (2021-07-02T14:31:44Z) - Intrinsic Dimension Estimation [92.87600241234344]
内在次元の新しい推定器を導入し, 有限標本, 非漸近保証を提供する。
次に、本手法を適用して、データ固有の次元に依存するGAN(Generative Adversarial Networks)に対する新しいサンプル複雑性境界を求める。
論文 参考訳(メタデータ) (2021-06-08T00:05:39Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。