論文の概要: Transforming variables to central normality
- arxiv url: http://arxiv.org/abs/2005.07946v2
- Date: Sat, 21 Nov 2020 17:41:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 12:47:25.954314
- Title: Transforming variables to central normality
- Title(参考訳): 変数の中央正規化への変換
- Authors: Jakob Raymaekers and Peter J. Rousseeuw
- Abstract要約: 変数をより正常にするためには、変数を前処理するのが慣例である。
Box-Cox と Yeo-Johnson 変換は、このためによく知られたツールである。
本稿では、これらの変換の修正と、オフ値に対して頑健な変換パラメータの推定手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real data sets contain numerical features (variables) whose distribution
is far from normal (gaussian). Instead, their distribution is often skewed. In
order to handle such data it is customary to preprocess the variables to make
them more normal. The Box-Cox and Yeo-Johnson transformations are well-known
tools for this. However, the standard maximum likelihood estimator of their
transformation parameter is highly sensitive to outliers, and will often try to
move outliers inward at the expense of the normality of the central part of the
data. We propose a modification of these transformations as well as an
estimator of the transformation parameter that is robust to outliers, so the
transformed data can be approximately normal in the center and a few outliers
may deviate from it. It compares favorably to existing techniques in an
extensive simulation study and on real data.
- Abstract(参考訳): 多くの実データ集合は、分布が正規(ガウシアン)に遠く及ばない数値的特徴(変数)を含む。
代わりに、その分布はしばしば歪められる。
このようなデータを扱うためには、変数をプリプロセスしてより正常にするのが慣例である。
Box-Cox および Yeo-Johnson 変換は、このためによく知られたツールである。
しかしながら、変換パラメータの標準最大度推定器は、外れ値に対して非常に敏感であり、データの中央部分の正規性を犠牲にして、外れ値を内側へ移動させようとすることが多い。
我々は,これらの変換の修正と,異常値にロバストな変換パラメータの推定器を提案する。
これは、広範囲なシミュレーション研究や実データにおいて、既存の技術と好適に比較できる。
関連論文リスト
- Data-driven path collective variables [0.0]
本稿では,集合変数の生成,最適化,比較のための新しい手法を提案する。
結果として得られる集合変数は1次元、解釈可能、微分可能である。
2つの異なるアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-12-21T14:07:47Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - Learning to Transform for Generalizable Instance-wise Invariance [48.647925994707855]
どのような画像であっても、正規化フローを使用して変換上の分布を予測し、それらの上の予測を平均化する。
この正規化フローはエンドツーエンドでトレーニングされており、AugerinoやInstaAugよりもはるかに広い範囲の変換を学ぶことができる。
CIFAR10, CIFAR10-LT, TinyImageNetの精度とロバスト性向上を示す。
論文 参考訳(メタデータ) (2023-09-28T17:59:58Z) - Context Normalization Layer with Applications [0.1499944454332829]
本研究では,画像データに対する文脈正規化と呼ばれる新しい正規化手法を提案する。
各サンプルの特性に基づいて特徴のスケーリングを調整し、モデルの収束速度と性能を改善する。
文脈正規化の有効性は様々なデータセットで示され、その性能は他の標準正規化手法と比較される。
論文 参考訳(メタデータ) (2023-03-14T06:38:17Z) - $p$-Generalized Probit Regression and Scalable Maximum Likelihood
Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。
p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文 参考訳(メタデータ) (2022-03-25T10:54:41Z) - Invariance Learning in Deep Neural Networks with Differentiable Laplace
Approximations [76.82124752950148]
我々はデータ拡張を選択するための便利な勾配法を開発した。
我々はKronecker-factored Laplace近似を我々の目的とする限界確率に近似する。
論文 参考訳(メタデータ) (2022-02-22T02:51:11Z) - Metadata Normalization [54.43363251520749]
バッチ正規化(bn)は、バッチ統計の標準化によって特徴分布を正規化する。
BNは外部変数や複数の分布からの影響を補正していない。
トレーニングフレームワーク内でエンドツーエンドで使用できる新しいバッチレベルのオペレーションであるMetadata Normalizationレイヤを紹介します。
論文 参考訳(メタデータ) (2021-04-19T05:10:26Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - Deep transformation models: Tackling complex regression problems with
neural network based transformation models [0.0]
確率回帰のための深層変換モデルを提案する。
これは、結果の不確実性を捉える最も徹底的な方法である条件付き確率分布全体を推定する。
本手法は複雑な入力データに対して有効であり,画像データにCNNアーキテクチャを適用して実演する。
論文 参考訳(メタデータ) (2020-04-01T14:23:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。