論文の概要: Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data
- arxiv url: http://arxiv.org/abs/2410.20335v1
- Date: Sun, 27 Oct 2024 04:25:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:21:45.513666
- Title: Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data
- Title(参考訳): 不均衡データのための直観的ファジィユニバーササポートベクトルマシン
- Authors: A. Quadir, M. Tanveer,
- Abstract要約: 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームツインサポートベクトルマシンを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: One of the major difficulties in machine learning methods is categorizing datasets that are imbalanced. This problem may lead to biased models, where the training process is dominated by the majority class, resulting in inadequate representation of the minority class. Universum twin support vector machine (UTSVM) produces a biased model towards the majority class, as a result, its performance on the minority class is often poor as it might be mistakenly classified as noise. Moreover, UTSVM is not proficient in handling datasets that contain outliers and noises. Inspired by the concept of incorporating prior information about the data and employing an intuitionistic fuzzy membership scheme, we propose intuitionistic fuzzy universum twin support vector machines for imbalanced data (IFUTSVM-ID). We use an intuitionistic fuzzy membership scheme to mitigate the impact of noise and outliers. Moreover, to tackle the problem of imbalanced class distribution, data oversampling and undersampling methods are utilized. Prior knowledge about the data is provided by universum data. This leads to better generalization performance. UTSVM is susceptible to overfitting risks due to the omission of the structural risk minimization (SRM) principle in their primal formulations. However, the proposed IFUTSVM-ID model incorporates the SRM principle through the incorporation of regularization terms, effectively addressing the issue of overfitting. We conduct a comprehensive evaluation of the proposed IFUTSVM-ID model on benchmark datasets from KEEL and compare it with existing baseline models. Furthermore, to assess the effectiveness of the proposed IFUTSVM-ID model in diagnosing Alzheimer's disease (AD), we applied them to the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset. Experimental results showcase the superiority of the proposed IFUTSVM-ID models compared to the baseline models.
- Abstract(参考訳): 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
この問題は、トレーニングプロセスが多数派に支配され、結果として少数派の表現が不十分な、バイアスのあるモデルに繋がる可能性がある。
ユニバーシャムツインサポートベクターマシン(UTSVM)は、多数派に対して偏りのあるモデルを生成するため、少数派ではノイズとして誤って分類される可能性があるため、性能が劣ることが多い。
さらに、UTSVMは、外れ値とノイズを含むデータセットを扱うのに熟練していない。
本研究では,データに関する事前情報を導入し,直観的ファジィメンバシップ方式を採用するという概念に着想を得て,不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームサポートベクトルマシンを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
さらに,不均衡なクラス分布の問題に対処するために,データオーバーサンプリングとアンダーサンプリング手法を用いる。
データに関する以前の知識は、ユニバーサムデータによって提供される。
これにより、より優れた一般化性能が得られる。
UTSVMは、その原始的な定式化における構造的リスク最小化(SRM)原則の欠如により、過度に適合するリスクに影響を受けやすい。
しかし、提案したIFUTSVM-IDモデルは、正規化項を組み込むことでSRMの原理を取り入れ、オーバーフィッティングの問題に効果的に対処する。
我々は,提案したIFUTSVM-IDモデルをKEELのベンチマークデータセット上で包括的に評価し,既存のベースラインモデルと比較する。
さらに、アルツハイマー病(AD)の診断におけるIFUTSVM-IDモデルの有効性を評価するために、アルツハイマー病神経画像イニシアチブ(ADNI)データセットに適用した。
実験の結果,提案したIFUTSVM-IDモデルの方がベースラインモデルよりも優れていることが示された。
関連論文リスト
- Granular Ball Twin Support Vector Machine [0.0]
MixtureTwinサポートベクターマシン(TSVM)における非パラメトリック可能性推定器は、分類および回帰作業に多目的に適用可能な、新興機械学習モデルである。
TSVMは、その効率性と大規模データセットの適用性に対する重大な障害に直面している。
粒状球双対支持ベクトルマシン(GBTSVM)と大型球双対支持ベクトルマシン(LS-GBTSVM)を提案する。
UCI,KEEL,NDCデータセットのベンチマークデータセットを用いて,GBTSVMおよびLS-GBTSVMモデルの総合評価を行う。
論文 参考訳(メタデータ) (2024-10-07T06:20:36Z) - Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文 参考訳(メタデータ) (2024-08-16T19:08:27Z) - Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。
異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文 参考訳(メタデータ) (2023-12-18T05:42:31Z) - MCRAGE: Synthetic Healthcare Data for Fairness [3.0089659534785853]
そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。
MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。
この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文 参考訳(メタデータ) (2023-10-27T19:02:22Z) - Graph Embedded Intuitionistic Fuzzy Random Vector Functional Link Neural
Network for Class Imbalance Learning [4.069144210024564]
クラス不均衡学習(GE-IFRVFL-CIL)モデルのためのグラフ埋め込み直観的ファジィRVFLを提案する。
提案したGE-IFRVFL-CILモデルは、クラス不均衡問題に対処し、ノイズとアウトレーヤの有害な効果を軽減し、データセットの固有の幾何学的構造を保存するための有望な解決策を提供する。
論文 参考訳(メタデータ) (2023-07-15T20:45:45Z) - Weighted Least Squares Twin Support Vector Machine with Fuzzy Rough Set
Theory for Imbalanced Data Classification [0.483420384410068]
サポートベクトルマシン(SVM)は、分類問題を解決するために開発された強力な教師付き学習ツールである。
重み付き最小二乗支援ベクトルマシンFRLSTSVMにおけるファジィ粗集合理論を不均衡データの分類に効率的に利用する手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T22:33:39Z) - Estimating Average Treatment Effects with Support Vector Machines [77.34726150561087]
サポートベクターマシン(SVM)は、機械学習文献で最も人気のある分類アルゴリズムの1つです。
我々はsvmをカーネルベースの重み付け手順として適用し,治療群と制御群の最大平均差を最小化する。
このトレードオフから生じる因果効果推定のバイアスを特徴づけ、提案されたSVM手順と既存のカーネルバランシング手法を結びつけます。
論文 参考訳(メタデータ) (2021-02-23T20:22:56Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。
我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。
これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文 参考訳(メタデータ) (2020-08-08T03:02:27Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。