論文の概要: Weighted Missing Linear Discriminant Analysis: An Explainable Approach for Classification with Missing Data
- arxiv url: http://arxiv.org/abs/2407.00710v1
- Date: Sun, 30 Jun 2024 14:21:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 01:57:25.929798
- Title: Weighted Missing Linear Discriminant Analysis: An Explainable Approach for Classification with Missing Data
- Title(参考訳): 重み付き線形判別分析:欠測データを用いた分類のための説明可能なアプローチ
- Authors: Tuan L. Vo, Uyen Dang, Thu Nguyen,
- Abstract要約: 本稿では,LDA(Linear Discriminant Analysis)に対する新しい手法を提案する。
我々は、欠落したデータに基づいてパラメータを直接推定し、欠落した値に重み行列を用いて分類中に欠落したエントリをペナルティ化する。
実験結果から,WLDAは従来の手法よりも有意差で優れていた。
- 参考スコア(独自算出の注目度): 1.4840867281815378
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As Artificial Intelligence (AI) models are gradually being adopted in real-life applications, the explainability of the model used is critical, especially in high-stakes areas such as medicine, finance, etc. Among the commonly used models, Linear Discriminant Analysis (LDA) is a widely used classification tool that is also explainable thanks to its ability to model class distributions and maximize class separation through linear feature combinations. Nevertheless, real-world data is frequently incomplete, presenting significant challenges for classification tasks and model explanations. In this paper, we propose a novel approach to LDA under missing data, termed \textbf{\textit{Weighted missing Linear Discriminant Analysis (WLDA)}}, to directly classify observations in data that contains missing values without imputation effectively by estimating the parameters directly on missing data and use a weight matrix for missing values to penalize missing entries during classification. Furthermore, we also analyze the theoretical properties and examine the explainability of the proposed technique in a comprehensive manner. Experimental results demonstrate that WLDA outperforms conventional methods by a significant margin, particularly in scenarios where missing values are present in both training and test sets.
- Abstract(参考訳): 人工知能(AI)モデルは、現実の応用において徐々に採用されつつあるため、特に医療や金融などの高度な分野において、使用されるモデルの説明可能性は非常に重要である。
一般的に使われているモデルの中で、LDA(Linear Discriminant Analysis)は、クラス分布をモデル化し、線形特徴結合を通じてクラス分離を最大化する能力によって説明可能な、広く使われている分類ツールである。
それでも、現実世界のデータはしばしば不完全であり、分類タスクやモデル説明に重大な課題を呈している。
本稿では, LDA の欠落データに対する新たなアプローチとして, 欠落データに直接パラメータを推定し, 欠落データを直接推定することにより, 欠落データを含むデータの観察を効果的に分類し, 欠落データに対する重み行列を用いて, 欠落データをペナルタイズする手法を提案する。
さらに,提案手法の理論的特性を総合的に分析し,その説明可能性について考察する。
実験結果から,WLDAは従来の手法よりも格段に優れており,特に,学習セットとテストセットの両方に欠落した値が存在する場合の方が優れていた。
関連論文リスト
- Partially Blinded Unlearning: Class Unlearning for Deep Networks a Bayesian Perspective [4.31734012105466]
マシン・アンラーニング(英: Machine Unlearning)とは、特定のデータセットやクラスに指定された情報を事前訓練されたモデルから選択的に破棄するプロセスである。
本研究では,事前学習した分類ネットワークから,特定の種類のデータに関連付けられた情報の目的的除去に適した手法を提案する。
本手法は,従来の最先端の未学習手法を超越し,優れた有効性を示す。
論文 参考訳(メタデータ) (2024-03-24T17:33:22Z) - Enhancing Interpretability and Generalizability in Extended Isolation Forests [5.139809663513828]
ExIFFI (Extended isolated Forest Feature Importance) は、EIF(Extended isolated Forest)モデルによる予測を説明する手法である。
EIF+は、修正された分割戦略により、見えない異常を検出するモデルの能力を高めるように設計されている。
ExIFFIは、11の現実世界のデータセットのうち8つで、他の教師なしの解釈可能性メソッドよりも優れています。
論文 参考訳(メタデータ) (2023-10-09T07:24:04Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Variation-Incentive Loss Re-weighting for Regression Analysis on Biased
Data [8.115323786541078]
モデルトレーニング中のデータ歪/バイアスに対処することで回帰分析の精度を向上させることを目的としている。
回帰分析のための勾配降下モデルトレーニングを最適化するために,変分集中損失再重み付け法(VILoss)を提案する。
論文 参考訳(メタデータ) (2021-09-14T10:22:21Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - On the Benefits of Invariance in Neural Networks [56.362579457990094]
データ拡張によるトレーニングは、リスクとその勾配をよりよく見積もることを示し、データ拡張でトレーニングされたモデルに対して、PAC-Bayes一般化を提供する。
また,データ拡張と比べ,平均化は凸損失を伴う場合の一般化誤差を低減し,PAC-Bayes境界を狭めることを示した。
論文 参考訳(メタデータ) (2020-05-01T02:08:58Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z) - Improving Covariance-Regularized Discriminant Analysis for EHR-based
Predictive Analytics of Diseases [20.697847129363463]
任意の分布を持つデータを分類するためのLDAの精度を理解する解析モデルについて検討する。
また、HDLSSデータのために開発された最先端のLDA手法より優れた新しいLDA分類器De-Sparseを提案する。
論文 参考訳(メタデータ) (2016-10-18T06:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。