論文の概要: Weighted Scaling Approach for Metabolomics Data Analysis
- arxiv url: http://arxiv.org/abs/2208.00603v1
- Date: Mon, 1 Aug 2022 04:23:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:16:20.007516
- Title: Weighted Scaling Approach for Metabolomics Data Analysis
- Title(参考訳): メタボロミクスデータ分析のための重み付けスケーリングアプローチ
- Authors: Biplab Biswas, Nishith Kumar, Md Aminul Hoque, Md Ashad Alam
- Abstract要約: メタボロミクスデータ分析では、体系的変動が一般的な問題である。
下流分析に適切なスケーリング手法を選択することは困難である。
既存のスケーリングテクニックは、外れ値や極端な値に敏感です。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Systematic variation is a common issue in metabolomics data analysis.
Therefore, different scaling and normalization techniques are used to
preprocess the data for metabolomics data analysis. Although several scaling
methods are available in the literature, however, choice of scaling,
transformation and/or normalization technique influence the further statistical
analysis. It is challenging to choose the appropriate scaling technique for
downstream analysis to get accurate results or to make a proper decision.
Moreover, the existing scaling techniques are sensitive to outliers or extreme
values. To fill the gap, our objective is to introduce a robust scaling
approach that is not influenced by outliers as well as provides more accurate
results for downstream analysis. Here, we introduced a new weighted scaling
approach that is robust against outliers however, where no additional outlier
detection/treatment step is needed in data preprocessing and also compared it
with the conventional scaling and normalization techniques through artificial
and real metabolomics datasets. We evaluated the performance of the proposed
method in comparison to the other existing conventional scaling techniques
using metabolomics data analysis in both the absence and presence of different
percentages of outliers. Results show that in most cases, the proposed scaling
technique performs better than the traditional scaling methods in both the
absence and presence of outliers. The proposed method improves the further
downstream metabolomics analysis. The R function of the proposed robust scaling
method is available at
https://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.R
- Abstract(参考訳): メタボロミクスデータ分析では、体系的変動が一般的な問題である。
したがって、さまざまなスケーリングと正規化技術を使用して、メタボロミクスデータ分析のためのデータを前処理する。
いくつかのスケーリング手法は文献で利用可能であるが、スケーリング、変換、および/または正規化技術の選択は、さらなる統計分析に影響を与える。
下流分析の適切なスケーリングテクニックを選択することで、正確な結果を得るか、あるいは適切な判断を下すことは困難である。
さらに、既存のスケーリングテクニックは、外れ値や極端な値に敏感です。
このギャップを埋めるため、当社の目標は、外れ値に影響されず、下流解析により正確な結果を提供する、堅牢なスケーリングアプローチの導入です。
ここでは,データ前処理に付加的な外れ値検出・処理ステップが不要となるような,外れ値に対して堅牢な新たなスケーリング手法を導入し,人工メタボロミクスデータセットによる従来のスケーリングおよび正規化手法と比較した。
メタボロミクスデータ解析を用いて, 従来のスケーリング手法と比較して, 提案手法の性能評価を行った。
その結果,多くの場合,提案手法は従来のスケーリング手法よりも,異常値の欠如と存在の両方において優れた性能を示すことがわかった。
提案手法はより下流のメタボロミクス解析を改善する。
提案手法のR関数はhttps://github.com/nishithkumarpaul/robustScaling/blob/main/wscaling.Rで利用可能である。
関連論文リスト
- Transfer Learning in $\ell_1$ Regularized Regression: Hyperparameter
Selection Strategy based on Sharp Asymptotic Analysis [4.178980693837599]
転送学習技術は、複数の関連するデータセットからの情報を活用し、ターゲットデータセットに対する予測品質を向上させることを目的としている。
トランス・ラッソ(Trans-Lasso)とプレトレーニング・ラッソ(Pretraining Lasso)である。
レプリカ法を用いて解析することにより,高次元環境下でのアルゴリズムの徹底的,精密な研究を行う。
微調整段階に転送される2種類の情報の1つを無視することは、一般化性能にはほとんど影響しない。
論文 参考訳(メタデータ) (2024-09-26T10:20:59Z) - DTization: A New Method for Supervised Feature Scaling [0.0]
フィーチャースケーリングは、機械学習アルゴリズムのパフォーマンスを改善するデータ前処理技術の1つである。
我々は、決定木とロバストなスケーラを用いて、教師付き機能スケーリングを行うDTizationという新しい機能スケーリング手法を提示した。
その結果,従来の機能スケーリング手法と比較して,優れたパフォーマンス向上が得られた。
論文 参考訳(メタデータ) (2024-04-27T15:25:03Z) - Hyperparameter tuning via trajectory predictions: Stochastic prox-linear
methods in matrix sensing [6.446062819763263]
ノイズにより劣化したランク1ガウス測度から未知のランク1行列を復元する問題を分析する。
我々は,この手法の正確な誤差を予測する決定論的再帰を導出する。
非漸近的なフレームワークを使用することで、これはどんなバッチサイズでも、幅広いステップサイズにも当てはまります。
論文 参考訳(メタデータ) (2024-02-02T17:55:12Z) - The choice of scaling technique matters for classification performance [6.745479230590518]
モノリシックモデルとアンサンブルモデルにおける5つのスケーリング手法が20の分類アルゴリズムの性能に与える影響を比較した。
その結果,ほとんどの場合,最高のスケーリング手法と最悪のスケーリング手法のパフォーマンス差は関連性があり,統計的に有意であることがわかった。
また,異なるスケーリング手法を考慮に入れたアンサンブルモデルの性能変動が,ベースモデルの性能変化によって予測される傾向があることを示す。
論文 参考訳(メタデータ) (2022-12-23T13:51:45Z) - Shape complexity in cluster analysis [0.0]
クラスタ分析において、一般的な第一歩は、データをクラスタに分割することを目的として、データをスケールすることだ。
ここでは,クラスタリングに先立って使用するスケーリング係数の獲得を目的として,データの多次元形状の利用について検討する。
いくつかの象徴的なデータセットで、新しいアプローチの強みと潜在的な弱点を強調します。
論文 参考訳(メタデータ) (2022-05-17T01:33:15Z) - Metadata Normalization [54.43363251520749]
バッチ正規化(bn)は、バッチ統計の標準化によって特徴分布を正規化する。
BNは外部変数や複数の分布からの影響を補正していない。
トレーニングフレームワーク内でエンドツーエンドで使用できる新しいバッチレベルのオペレーションであるMetadata Normalizationレイヤを紹介します。
論文 参考訳(メタデータ) (2021-04-19T05:10:26Z) - Scalable Marginal Likelihood Estimation for Model Selection in Deep
Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。
本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文 参考訳(メタデータ) (2021-04-11T09:50:24Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Compressing Large Sample Data for Discriminant Analysis [78.12073412066698]
判別分析フレームワーク内での大きなサンプルサイズに起因する計算問題を考察する。
線形および二次判別分析のためのトレーニングサンプル数を削減するための新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2020-05-08T05:09:08Z) - Dynamic Scale Training for Object Detection [111.33112051962514]
本稿では,オブジェクト検出におけるスケール変動問題を軽減するために,動的スケールトレーニングパラダイム(DST)を提案する。
提案したDSTのスケール変動処理に対する有効性を示す実験結果を得た。
推論オーバーヘッドを導入せず、一般的な検出設定のための無料ランチとして機能する。
論文 参考訳(メタデータ) (2020-04-26T16:48:17Z) - Implicit differentiation of Lasso-type models for hyperparameter
optimization [82.73138686390514]
ラッソ型問題に適した行列逆転のない効率的な暗黙微分アルゴリズムを提案する。
提案手法は,解の空間性を利用して高次元データにスケールする。
論文 参考訳(メタデータ) (2020-02-20T18:43:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。