論文の概要: SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data
- arxiv url: http://arxiv.org/abs/2603.06251v1
- Date: Fri, 06 Mar 2026 13:10:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.78406
- Title: SPPCSO: Adaptive Penalized Estimation Method for High-Dimensional Correlated Data
- Title(参考訳): SPPCSO:高次元相関データに対する適応的ペナル化推定法
- Authors: Ying Hu, Hu Yang,
- Abstract要約: 本研究では, 単パラメータ主成分選択演算子 (SPPCSO) を提案する。
単パラメトリックの主成分回帰と$L_1$正規化を統合し、主成分情報を組み込むことで収縮率を適応的に調整する。
可変選択と係数推定のバランスを保ち、高次元高雑音環境においてもモデル安定性とロバスト推定を確実にする。
- 参考スコア(独自算出の注目度): 7.338284747998038
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rise of high-dimensional correlated data, multicollinearity poses a significant challenge to model stability, often leading to unstable estimation and reduced predictive accuracy. This work proposes the Single-Parametric Principal Component Selection Operator (SPPCSO), an innovative penalized estimation method that integrates single-parametric principal component regression and $L_{1}$ regularization to adaptively adjust the shrinkage factor by incorporating principal component information. This approach achieves a balance between variable selection and coefficient estimation, ensuring model stability and robust estimation even in high-dimensional, high-noise environments. The primary contribution lies in addressing the instability of traditional variable selection methods when applied to high-noise, high-dimensional correlated data. Theoretically, our method exhibits selection consistency and achieves a smaller estimation error bound compared to traditional penalized estimation approaches. Extensive numerical experiments demonstrate that SPPCSO not only delivers stable and reliable estimation in high-noise settings but also accurately distinguishes signal variables from noise variables in group-effect structured data with highly correlated noise variables, effectively eliminating redundant variables and achieving more stable variable selection. Furthermore, SPPCSO successfully identifies disease-associated genes in gene expression data analysis, showcasing strong practical value. The results indicate that SPPCSO serves as an ideal tool for high-dimensional variable selection, offering an efficient and interpretable solution for modeling correlated data.
- Abstract(参考訳): 高次元相関データの増加に伴い、多重線型性はモデルの安定性に重大な課題をもたらし、しばしば不安定な推定と予測精度の低下につながる。
本研究では、単パラメトリック主成分回帰と$L_{1}$正規化を統合し、主成分情報を組み込むことで収縮係数を適応的に調整する、一パラメータ主成分選択演算子(SPPCSO)を提案する。
このアプローチは,高次元高雑音環境においても,変数選択と係数推定のバランスを保ち,モデル安定性とロバスト推定を確実にする。
主な貢献は、高ノイズ・高次元相関データに適用する場合、従来の変数選択法の不安定性に対処することにある。
理論的には,提案手法は選択整合性を示し,従来のペナル化推定手法と比較して誤差を小さくする。
大規模な数値実験により,SPPCSOは高雑音条件下で安定かつ信頼性の高い推定を行うだけでなく,高相関のノイズ変数を持つ群効果構造化データにおいて,信号変数と雑音変数を正確に区別し,冗長変数を効果的に排除し,より安定な変数選択を実現する。
さらに、SPPCSOは遺伝子発現データ解析において疾患関連遺伝子を同定し、強力な実用的価値を示す。
その結果,SPPCSOは高次元変数選択の理想的なツールであり,相関データをモデル化するための効率的かつ解釈可能なソリューションであることがわかった。
関連論文リスト
- Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics [0.0]
データ正規化は、マグニチュードベースのスパース回帰法による支配方程式の発見を著しく歪めることができる。
本稿では,新しい計算効率の高いスパース回帰アルゴリズムSTCV(Sequential Thresholding of Coefficient of Variation)を提案する。
そこで本研究では,STCVに基づく手法が,他の手法が失敗した場合でも,正しい,まばらな物理法則を正しく識別できることを示す。
論文 参考訳(メタデータ) (2026-03-05T14:11:22Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Denoising diffusion networks for normative modeling in neuroimaging [1.0195618602298684]
ほとんどの神経画像パイプラインは画像由来表現型(IDP)の1つのモデルに適合する
IDPの統一条件密度推定器として拡散確率モデル(DDPM)を提案する。
ヘテロセダスティックおよびマルチモーダルな年齢効果を持つ合成ベンチマークと,英国バイオバンクフリーサーファー表現型を用いて,次元2~200のスケールで評価した。
論文 参考訳(メタデータ) (2026-01-24T06:19:10Z) - Diffusion-Driven High-Dimensional Variable Selection [6.993247097440294]
本稿では,高忠実度合成データを生成する拡散モデルの能力を生かした再サンプル集約フレームワークを提案する。
提案手法は軽微な仮定の下で一貫した選択であることを示す。
本手法は,変数選択手法を改良し,統計的に厳密な解析を行うためのツールキットを拡充する。
論文 参考訳(メタデータ) (2025-08-19T14:54:20Z) - A Distributionally-Robust Framework for Nuisance in Causal Effect Estimation [1.3053649021965603]
因果推論では、治療群と対照群の間のバランスの取れた分布のモデルを評価する必要がある。
最も一般的な統計手法は、逆確率重み付け(IPW)によるこの分布シフトに対処するものである。
誤差一般化を分解してこれらの問題 - 正当性あいまいさと統計的不安定さ - を分離し, 対向損失関数を通して対処する。
論文 参考訳(メタデータ) (2025-05-23T10:34:28Z) - Assumption-Lean Post-Integrated Inference with Surrogate Control Outcomes [6.448728765953916]
制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々は、予測された直接効果推定に関する半パラメトリック推論を開発し、隠された仲介者、共同設立者、モデレーターを考慮に入れた。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。