論文の概要: Multiple Testing of Linear Forms for Noisy Matrix Completion
- arxiv url: http://arxiv.org/abs/2312.00305v1
- Date: Fri, 1 Dec 2023 02:53:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 15:50:14.140492
- Title: Multiple Testing of Linear Forms for Noisy Matrix Completion
- Title(参考訳): 雑音行列完全化のための線形形式の多重テスト
- Authors: Wanteng Ma, Lilun Du, Dong Xia and Ming Yuan
- Abstract要約: 急激な新しい統計値を持つ個別試験のための新しい統計値を導入することで、難易度を克服する一般的な手法を開発する。
ほぼ最適なサンプルサイズ条件下で、有効FDR制御が保証されたパワーで達成可能であることを示す。
- 参考スコア(独自算出の注目度): 14.496082411670677
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many important tasks of large-scale recommender systems can be naturally cast
as testing multiple linear forms for noisy matrix completion. These problems,
however, present unique challenges because of the subtle bias-and-variance
tradeoff of and an intricate dependence among the estimated entries induced by
the low-rank structure. In this paper, we develop a general approach to
overcome these difficulties by introducing new statistics for individual tests
with sharp asymptotics both marginally and jointly, and utilizing them to
control the false discovery rate (FDR) via a data splitting and symmetric
aggregation scheme. We show that valid FDR control can be achieved with
guaranteed power under nearly optimal sample size requirements using the
proposed methodology. Extensive numerical simulations and real data examples
are also presented to further illustrate its practical merits.
- Abstract(参考訳): 大規模レコメンダシステムの多くの重要なタスクは、ノイズの多い行列補完のための複数の線形形式のテストとして自然にキャストできる。
しかし、これらの問題は、低ランク構造によって引き起こされる推定エントリ間の微妙なバイアスと分散のトレードオフと複雑な依存性によって、ユニークな課題を呈している。
本稿では,これらの課題を克服するための一般的な手法として,シャープな漸近性を持つ個々の検定のための新しい統計データを導入し,データ分割と対称アソシエーション方式による偽発見率(FDR)の制御に活用する。
提案手法を用いて, ほぼ最適なサンプルサイズ条件下で, 有効なFDR制御を実現することができることを示す。
実際の数値シミュレーションや実データ例も提示され、その実用性がさらに説明されている。
関連論文リスト
- Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Exploring Unified Perspective For Fast Shapley Value Estimation [77.15924044466976]
共有値の単純かつ効率的な推定法であるSimSHAPを提案する。
実験により,SimSHAPの有効性が検証され,精度の高いShapley値の計算が大幅に高速化された。
論文 参考訳(メタデータ) (2023-11-02T06:09:24Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - GAR: Generalized Autoregression for Multi-Fidelity Fusion [16.464126364802283]
一般化自己回帰(GAR)は、低忠実度(高速だが不正確な)と高忠実度(スローだが正確な)シミュレーションの結果を組み合わせるために提案される。
ガーは任意の次元出力と任意の多面体データ構造に対処し、多面体融合の需要を満たすことができる。
Gar は SOTA 法を高いマージン(RMSE の最大 6 倍の改善)で一貫して上回り、高忠実度トレーニングサンプルはわずか2 つしかない。
論文 参考訳(メタデータ) (2023-01-13T19:10:25Z) - Near-optimal multiple testing in Bayesian linear models with
finite-sample FDR control [11.011242089340438]
高次元変数選択問題では、統計学者はしばしば偽発見率(FDR)を制御する複数の試験手順を設計しようと試みる。
モデルが誤って特定された場合でも、有限サンプルから頻繁なFDRを確実に制御するModel-Xプロシージャを導入する。
提案手法であるPoEdCeは, 後期待, 蒸留ランダム化試験 (dCRT) , およびE値を用いたBenjamini-Hochberg法である。
論文 参考訳(メタデータ) (2022-11-04T22:56:41Z) - MaxMatch: Semi-Supervised Learning with Worst-Case Consistency [149.03760479533855]
半教師付き学習(SSL)のための最悪ケース整合正則化手法を提案する。
本稿では,ラベル付きトレーニングデータとラベル付きトレーニングデータとを別々に比較した経験的損失項からなるSSLの一般化について述べる。
この境界によって動機づけられたSSLの目的は、元のラベルのないサンプルと、その複数の拡張版との最大の矛盾を最小限に抑えるものである。
論文 参考訳(メタデータ) (2022-09-26T12:04:49Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Calibrating Over-Parametrized Simulation Models: A Framework via
Eligibility Set [3.862247454265944]
厳密な頻繁な統計的保証を満たす校正手法を開発するための枠組みを開発する。
本手法は,書籍市場シミュレータのキャリブレーションへの応用を含む,いくつかの数値例で実証する。
論文 参考訳(メタデータ) (2021-05-27T00:59:29Z) - Effective multi-view registration of point sets based on student's t
mixture model [15.441928157356477]
本稿では,学生のt混合モデル(StMM)に基づく効果的な登録手法を提案する。
NNサーチ法により全てのt分布セントロイドが得られるため、マルチビュー登録を実現するのがより効率的である。
実験結果は,最先端手法よりも優れた性能と精度を示す。
論文 参考訳(メタデータ) (2020-12-13T08:27:29Z) - Sparse Methods for Automatic Relevance Determination [0.0]
まず、自動妥当性決定(ARD)について検討し、スパースモデルを実現するために、追加の正規化やしきい値設定の必要性を解析的に実証する。
次に、正規化ベースとしきい値ベースという2つの手法のクラスについて論じる。
論文 参考訳(メタデータ) (2020-05-18T14:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。