論文の概要: Transfer learning via Regularized Linear Discriminant Analysis
- arxiv url: http://arxiv.org/abs/2501.02411v1
- Date: Sun, 05 Jan 2025 01:25:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:09:13.221299
- Title: Transfer learning via Regularized Linear Discriminant Analysis
- Title(参考訳): 正規化線形判別分析による伝達学習
- Authors: Hongzhe Zhang, Arnab Auddy, Hongzhe Lee,
- Abstract要約: 本稿では,正規化ランダム効果線形判別分析による新しい伝達学習手法を提案する。
これらの重みの値とそれに伴う分類誤差率を高次元設定で導出する。
- 参考スコア(独自算出の注目度): 2.321323878201932
- License:
- Abstract: Linear discriminant analysis is a widely used method for classification. However, the high dimensionality of predictors combined with small sample sizes often results in large classification errors. To address this challenge, it is crucial to leverage data from related source models to enhance the classification performance of a target model. We propose to address this problem in the framework of transfer learning. In this paper, we present novel transfer learning methods via regularized random-effects linear discriminant analysis, where the discriminant direction is estimated as a weighted combination of ridge estimates obtained from both the target and source models. Multiple strategies for determining these weights are introduced and evaluated, including one that minimizes the estimation risk of the discriminant vector and another that minimizes the classification error. Utilizing results from random matrix theory, we explicitly derive the asymptotic values of these weights and the associated classification error rates in the high-dimensional setting, where $p/n \rightarrow \infty$, with $p$ representing the predictor dimension and $n$ the sample size. We also provide geometric interpretations of various weights and a guidance on which weights to choose. Extensive numerical studies, including simulations and analysis of proteomics-based 10-year cardiovascular disease risk classification, demonstrate the effectiveness of the proposed approach.
- Abstract(参考訳): 線形判別分析は広く使われている分類法である。
しかし、予測器の高次元と小さなサンプルサイズの組み合わせは、しばしば大きな分類誤差をもたらす。
この課題に対処するためには、対象モデルの分類性能を高めるために、関連するソースモデルからのデータを活用することが不可欠である。
本稿では,伝達学習の枠組みにおいてこの問題に対処することを提案する。
本稿では,正規化ランダムエフェクト線形判別分析による新しい伝達学習手法を提案する。
これらの重みを決定するための複数の戦略を導入・評価し、識別ベクトルの推定リスクを最小化する戦略と、分類誤差を最小化する戦略を含む。
ランダム行列理論の結果を利用して、これらの重みの漸近値とそれに関連する分類誤差率を高次元設定で明らかに導出し、そこでは、$p/n \rightarrow \infty$、$p$は予測次元を表し、$n$はサンプルサイズを表す。
また、様々な重みの幾何学的解釈と、どの重みを選択するかのガイダンスも提供する。
プロテオミクスに基づく10年間の心血管疾患リスク分類のシミュレーションと解析を含む大規模な数値研究は,提案手法の有効性を実証している。
関連論文リスト
- FEMDA: a unified framework for discriminant analysis [4.6040036610482655]
非ガウスデータセットを扱うための新しいアプローチを提案する。
考慮されているモデルは、任意のスケールパラメータを持つクラスタ毎の任意の対称性(ES)分布である。
新しい決定規則を導出することにより,最大値のパラメータ推定と分類が,最先端手法と比較してシンプルで効率的で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-11-13T17:59:37Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Unobserved classes and extra variables in high-dimensional discriminant
analysis [9.467899386491204]
教師付き分類問題では、テストセットは学習フェーズで観察されていないクラスに属するデータポイントを含むことができる。
モデルに基づく判別手法D-AMDA(Dimension-Adaptive Mixture Discriminant Analysis)を提案する。
観測されていないクラスを検出し、次元の増大に適応することができる。
論文 参考訳(メタデータ) (2021-02-03T10:01:52Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Asymptotic Behavior of Adversarial Training in Binary Classification [41.7567932118769]
敵の訓練は、敵の攻撃に対する防衛の最先端の方法と考えられている。
実際に成功したにもかかわらず、敵の訓練のパフォーマンスを理解する上でのいくつかの問題は未解決のままである。
2進分類における対角訓練の最小化のための正確な理論的予測を導出する。
論文 参考訳(メタデータ) (2020-10-26T01:44:20Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。