論文の概要: Component-wise Adaptive Trimming For Robust Mixture Regression
- arxiv url: http://arxiv.org/abs/2005.11599v3
- Date: Mon, 19 Apr 2021 15:54:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 03:54:19.345467
- Title: Component-wise Adaptive Trimming For Robust Mixture Regression
- Title(参考訳): ロバスト混合回帰のためのコンポーネントワイド適応トリミング
- Authors: Wennan Chang, Xinyu Zhou, Yong Zang, Chi Zhang, Sha Cao
- Abstract要約: 既存のロバストな混合回帰法は、外層の存在下で外層推定を行うか、汚染レベルに関する事前の知識に依存するため、外層評価に苦しむ。
本稿では,適応的適応成分法 (Adaptive-wise Adaptive Component, CAT) と呼ばれる高速で効率的な混合回帰アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 15.633993488010292
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Parameter estimation of mixture regression model using the expectation
maximization (EM) algorithm is highly sensitive to outliers. Here we propose a
fast and efficient robust mixture regression algorithm, called Component-wise
Adaptive Trimming (CAT) method. We consider simultaneous outlier detection and
robust parameter estimation to minimize the effect of outlier contamination.
Robust mixture regression has many important applications including in human
cancer genomics data, where the population often displays strong heterogeneity
added by unwanted technological perturbations. Existing robust mixture
regression methods suffer from outliers as they either conduct parameter
estimation in the presence of outliers, or rely on prior knowledge of the level
of outlier contamination. CAT was implemented in the framework of
classification expectation maximization, under which a natural definition of
outliers could be derived. It implements a least trimmed squares (LTS) approach
within each exclusive mixing component, where the robustness issue could be
transformed from the mixture case to simple linear regression case. The high
breakdown point of the LTS approach allows us to avoid the pre-specification of
trimming parameter. Compared with multiple existing algorithms, CAT is the most
competitive one that can handle and adaptively trim off outliers as well as
heavy tailed noise, in different scenarios of simulated data and real genomic
data. CAT has been implemented in an R package `RobMixReg' available in CRAN.
- Abstract(参考訳): 予測最大化(EM)アルゴリズムを用いた混合回帰モデルのパラメータ推定は、外れ値に非常に敏感である。
本稿では Component-wise Adaptive Trimming (CAT) 法と呼ばれる高速で効率的な混合回帰アルゴリズムを提案する。
我々は,同時異常検出とロバストパラメータ推定を考慮し,異常汚染の影響を最小限に抑える。
ロバスト混合回帰は、ヒトがんゲノムデータなど多くの重要な応用があり、人口は望ましくない技術的な摂動によって付加される強い不均一性を示すことが多い。
既存のロバスト混合回帰法は、外れ値の存在下でパラメータ推定を行うか、外れ値汚染のレベルに関する事前知識に依存するため、外れ値に苦しむ。
CATは分類期待の最大化の枠組みで実装され、そこでは自然に外接値の定義を導出できる。
各排他的混合成分に最小トリミング正方形(LTS)アプローチを実装し、そこではロバスト性の問題が混合の場合から単純な線形回帰ケースに変換される。
LTSアプローチの高分解点により、トリミングパラメータの事前特定を避けることができる。
複数の既存アルゴリズムと比較して、CATは、シミュレーションデータと実際のゲノムデータの異なるシナリオにおいて、外れ値と重い尾のノイズを処理し、適応的にトリミングできる最も競争力のあるアルゴリズムである。
CAT は CRAN で利用可能な R パッケージ ‘RobMixReg' で実装されている。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Error Reduction from Stacked Regressions [12.657895453939298]
積み重ね回帰は、予測精度を高めるために異なる回帰推定器の線形結合を形成するアンサンブル手法である。
本稿では,非負性制約を受ける経験的リスクの正規化バージョンを最小化することにより,これらの重みを類似的に学習する。
適応的縮小効果により、結果として生じる累積推定量は、最も優れた単一推定値よりも人口リスクが厳しく小さい。
論文 参考訳(メタデータ) (2023-09-18T15:42:12Z) - Stability-Adjusted Cross-Validation for Sparse Linear Regression [5.156484100374059]
k倍のクロスバリデーションのようなクロスバリデーション技術はスパース回帰の計算コストを大幅に増大させる。
クロスバリデーションメトリックの重み付け和とモデルの出力安定性を最小化するハイパーパラメータの選択を提案する。
我々の信頼度調整手順は、13の実世界のデータセット上で、テストセットエラーを平均で2%削減する。
論文 参考訳(メタデータ) (2023-06-26T17:02:45Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - A Statistics and Deep Learning Hybrid Method for Multivariate Time
Series Forecasting and Mortality Modeling [0.0]
Exponential Smoothing Recurrent Neural Network (ES-RNN)は、統計予測モデルとリカレントニューラルネットワークのハイブリッドである。
ES-RNNはMakridakis-4 Forecasting Competitionで絶対誤差を9.4%改善した。
論文 参考訳(メタデータ) (2021-12-16T04:44:19Z) - Gaining Outlier Resistance with Progressive Quantiles: Fast Algorithms
and Theoretical Studies [1.6457778420360534]
任意の損失関数を強固化するために, 外部抵抗推定の枠組みを導入する。
通常のデータセットでは、データ再見積の回数を大幅に削減できるような、開始点の要件を緩和する新しい手法が提案されている。
得られた推定器は、必ずしも大域的でも大域的でもなくても、両方の低次元において最適性を楽しむことができる。
論文 参考訳(メタデータ) (2021-12-15T20:35:21Z) - Risk Bounds for Over-parameterized Maximum Margin Classification on
Sub-Gaussian Mixtures [100.55816326422773]
線形分類問題に対する最大マージン分類器の現象について検討する。
その結果、良性的なオーバーフィットが起きる条件を正確に特徴づけます。
論文 参考訳(メタデータ) (2021-04-28T08:25:16Z) - Robust regression with covariate filtering: Heavy tails and adversarial
contamination [6.939768185086755]
より強い汚染モデルにおいて,ハマー回帰,最小トリミング正方形,最小絶対偏差推定器を同時に計算および統計的に効率的に推定する方法を示す。
この設定では、ハマー回帰推定器がほぼ最適誤差率を達成するのに対し、最小のトリミング正方形と最小の絶対偏差推定器は、後処理ステップを適用した後、ほぼ最適誤差を達成することができる。
論文 参考訳(メタデータ) (2020-09-27T22:48:48Z) - Fast OSCAR and OWL Regression via Safe Screening Rules [97.28167655721766]
順序付き$L_1$ (OWL)正規化回帰は、高次元スパース学習のための新しい回帰分析である。
近勾配法はOWL回帰を解くための標準手法として用いられる。
未知の順序構造を持つ原始解の順序を探索することにより、OWL回帰の最初の安全なスクリーニングルールを提案する。
論文 参考訳(メタデータ) (2020-06-29T23:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。