論文の概要: A more efficient method for large-sample model-free feature screening via multi-armed bandits
- arxiv url: http://arxiv.org/abs/2509.16085v1
- Date: Fri, 19 Sep 2025 15:30:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.226734
- Title: A more efficient method for large-sample model-free feature screening via multi-armed bandits
- Title(参考訳): マルチアームバンディットによる大規模モデルフリー特徴スクリーニングの効率化
- Authors: Xiaxue Ouyang, Xinlai Kang, Mengyu Li, Zhenxing Dou, Jun Yu, Cheng Meng,
- Abstract要約: ランクベースモデルフリーな独立性スクリーニング手法 (CR-SIS) と, その効率的な変種であるBanditCR-SISを提案する。
n × p の予測行列の場合、CR-SIS の計算コストは O(nlog(n)p) であり、BanditCR-SIS はこれを O(sqrt(n)log(n)p + nlog(n)) に還元する。
- 参考スコア(独自算出の注目度): 13.683056699877369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the model-free feature screening in large-scale ultrahigh-dimensional data analysis. Existing feature screening methods often face substantial computational challenges when dealing with large sample sizes. To alleviate the computational burden, we propose a rank-based model-free sure independence screening method (CR-SIS) and its efficient variant, BanditCR-SIS. The CR-SIS method, based on Chatterjee's rank correlation, is as straightforward to implement as the sure independence screening (SIS) method based on Pearson correlation introduced by Fan and Lv(2008), but it is significantly more powerful in detecting nonlinear relationships between variables. Motivated by the multi-armed bandit (MAB) problem, we reformulate the feature screening procedure to significantly reduce the computational complexity of CR-SIS. For a predictor matrix of size n \times p, the computational cost of CR-SIS is O(nlog(n)p), while BanditCR-SIS reduces this to O(\sqrt(n)log(n)p + nlog(n)). Theoretically, we establish the sure screening property for both CR-SIS and BanditCR-SIS under mild regularity conditions. Furthermore, we demonstrate the effectiveness of our methods through extensive experimental studies on both synthetic and real-world datasets. The results highlight their superior performance compared to classical screening methods, requiring significantly less computational time.
- Abstract(参考訳): 大規模超高次元データ解析におけるモデルフリーな特徴スクリーニングについて考察する。
既存の特徴スクリーニング手法は、大きなサンプルサイズを扱う場合、かなりの計算上の問題に直面することが多い。
計算負荷を軽減するため,ランクベースのモデルフリーな独立スクリーニング手法 (CR-SIS) と,その効率的な変種であるBanditCR-SISを提案する。
Chatterjeeのランク相関に基づくCR-SIS法は、FanとLv(2008)によって導入されたピアソン相関に基づく独立スクリーニング(SIS)法と同様に、容易に実装できるが、変数間の非線形関係を検出する上で、はるかに強力である。
マルチアームバンディット (MAB) 問題に触発され, CR-SIS の計算複雑性を大幅に低減するため, 特徴スクリーニングの手順を改訂した。
大きさ n の予測行列 p に対し、CR-SIS の計算コストは O(nlog(n)p) であり、BanditCR-SIS はこれを O(\sqrt(n)log(n)p + nlog(n))) に還元する。
理論的には、穏やかな規則性条件下でCR-SISとBanditCR-SISの両方のスクリーニング特性を確立する。
さらに,本手法の有効性を,合成データセットと実世界のデータセットの両方に関する広範な実験的研究を通じて実証する。
その結果,従来のスクリーニング法に比べて優れた性能を示し,計算時間を大幅に短縮した。
関連論文リスト
- Ridge partial correlation screening for ultrahigh-dimensional data [7.116183305970674]
本稿では, 絶対試料尾根部分相関の順序付けに基づく, 新規かつ簡易なスクリーニング手法を提案する。
提案手法は回帰係数のリッジ正規化推定だけでなく,予測変数のリッジ正規化部分分散も考慮する。
論文 参考訳(メタデータ) (2025-04-27T23:52:44Z) - Sample-Efficient "Clustering and Conquer" Procedures for Parallel Large-Scale Ranking and Selection [0.0]
並列コンピューティングにおいてよく使われる「分割と征服」フレームワークを,相関に基づくクラスタリングのステップを追加して修正する。
この一見単純な修正は、広く使われている大規模R&Sプロシージャの効率的なクラスに対して最適なサンプル複雑性の低減を実現する。
ニューラルネットワーク探索のような大規模AIアプリケーションでは,本手法は優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-03T15:56:03Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Scalable Spatiotemporally Varying Coefficient Modelling with Bayesian Kernelized Tensor Regression [17.158289775348063]
カーネル化されたテンソル回帰(BKTR)は、低ランクの時間構造を持つモデリングプロセスに対する新しいスケーラブルなアプローチと考えられる。
そこで本研究では,BKTRのモデル推定と推定において,BKTRの優れた性能と効率性を確認した。
論文 参考訳(メタデータ) (2021-08-31T19:22:23Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。