Fugu-MT 論文翻訳(概要): Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data

論文の概要: Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data

arxiv url: http://arxiv.org/abs/2410.20335v1
Date: Sun, 27 Oct 2024 04:25:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:40.930732
Title: Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data
Title（参考訳）: 不均衡データのための直観的ファジィユニバーササポートベクトルマシン
Authors: A. Quadir, M. Tanveer,
Abstract要約: 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームツインサポートベクトルマシンを提案する。雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: One of the major difficulties in machine learning methods is categorizing datasets that are imbalanced. This problem may lead to biased models, where the training process is dominated by the majority class, resulting in inadequate representation of the minority class. Universum twin support vector machine (UTSVM) produces a biased model towards the majority class, as a result, its performance on the minority class is often poor as it might be mistakenly classified as noise. Moreover, UTSVM is not proficient in handling datasets that contain outliers and noises. Inspired by the concept of incorporating prior information about the data and employing an intuitionistic fuzzy membership scheme, we propose intuitionistic fuzzy universum twin support vector machines for imbalanced data (IFUTSVM-ID). We use an intuitionistic fuzzy membership scheme to mitigate the impact of noise and outliers. Moreover, to tackle the problem of imbalanced class distribution, data oversampling and undersampling methods are utilized. Prior knowledge about the data is provided by universum data. This leads to better generalization performance. UTSVM is susceptible to overfitting risks due to the omission of the structural risk minimization (SRM) principle in their primal formulations. However, the proposed IFUTSVM-ID model incorporates the SRM principle through the incorporation of regularization terms, effectively addressing the issue of overfitting. We conduct a comprehensive evaluation of the proposed IFUTSVM-ID model on benchmark datasets from KEEL and compare it with existing baseline models. Furthermore, to assess the effectiveness of the proposed IFUTSVM-ID model in diagnosing Alzheimer's disease (AD), we applied them to the Alzheimer's Disease Neuroimaging Initiative (ADNI) dataset. Experimental results showcase the superiority of the proposed IFUTSVM-ID models compared to the baseline models.
Abstract（参考訳）: 機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。この問題は、トレーニングプロセスが多数派に支配され、結果として少数派の表現が不十分な、バイアスのあるモデルに繋がる可能性がある。ユニバーシャムツインサポートベクターマシン(UTSVM)は、多数派に対して偏りのあるモデルを生成するため、少数派ではノイズとして誤って分類される可能性があるため、性能が劣ることが多い。さらに、UTSVMは、外れ値とノイズを含むデータセットを扱うのに熟練していない。本研究では,データに関する事前情報を導入し,直観的ファジィメンバシップ方式を採用するという概念に着想を得て,不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームサポートベクトルマシンを提案する。雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。さらに,不均衡なクラス分布の問題に対処するために,データオーバーサンプリングとアンダーサンプリング手法を用いる。データに関する以前の知識は、ユニバーサムデータによって提供される。これにより、より優れた一般化性能が得られる。 UTSVMは、その原始的な定式化における構造的リスク最小化(SRM)原則の欠如により、過度に適合するリスクに影響を受けやすい。しかし、提案したIFUTSVM-IDモデルは、正規化項を組み込むことでSRMの原理を取り入れ、オーバーフィッティングの問題に効果的に対処する。我々は,提案したIFUTSVM-IDモデルをKEELのベンチマークデータセット上で包括的に評価し,既存のベースラインモデルと比較する。さらに、アルツハイマー病(AD)の診断におけるIFUTSVM-IDモデルの有効性を評価するために、アルツハイマー病神経画像イニシアチブ(ADNI)データセットに適用した。実験の結果,提案したIFUTSVM-IDモデルの方がベースラインモデルよりも優れていることが示された。

関連論文リスト

Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文参考訳（メタデータ） (2025-10-03T14:00:32Z)
Granular Ball Twin Support Vector Machine [0.0]
MixtureTwinサポートベクターマシン(TSVM)における非パラメトリック可能性推定器は、分類および回帰作業に多目的に適用可能な、新興機械学習モデルである。 TSVMは、その効率性と大規模データセットの適用性に対する重大な障害に直面している。粒状球双対支持ベクトルマシン(GBTSVM)と大型球双対支持ベクトルマシン(LS-GBTSVM)を提案する。 UCI,KEEL,NDCデータセットのベンチマークデータセットを用いて,GBTSVMおよびLS-GBTSVMモデルの総合評価を行う。
論文参考訳（メタデータ） (2024-10-07T06:20:36Z)
Semi-Supervised Reward Modeling via Iterative Self-Training [52.48668920483908]
本稿では,未ラベルデータを用いたRMトレーニングを強化する手法であるSemi-Supervised Reward Modeling (SSRM)を提案する。 SSRMは、追加のラベリングコストを発生させることなく、報酬モデルを大幅に改善することを示した。全体として、SSRMは、人間が注釈付けした大量のデータへの依存を大幅に減らし、効果的な報酬モデルのトレーニングに要する全体的なコストと時間を削減する。
論文参考訳（メタデータ） (2024-09-10T22:57:58Z)
Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文参考訳（メタデータ） (2024-08-16T19:08:27Z)
Fairness-Aware Data Augmentation for Cardiac MRI using Text-Conditioned Diffusion Models [1.6581402323174208]
本稿では,データセットに固有の不均衡を,合成データの生成によって緩和する手法を提案する。我々は,患者メタデータと心臓の形状から合成したテキストを条件に,拡散確率モデルに基づく制御ネットを採用する。本実験は,データセットの不均衡を緩和する手法の有効性を実証するものである。
論文参考訳（メタデータ） (2024-03-28T15:41:43Z)
Model Stealing Attack against Graph Classification with Authenticity, Uncertainty and Diversity [80.16488817177182]
GNNは、クエリ許可を通じてターゲットモデルを複製するための悪行であるモデル盗難攻撃に対して脆弱である。異なるシナリオに対応するために,3つのモデルステルス攻撃を導入する。
論文参考訳（メタデータ） (2023-12-18T05:42:31Z)
MCRAGE: Synthetic Healthcare Data for Fairness [3.0089659534785853]
そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。 MCRAGEは、デノイング拡散確率モデル (Denoising Diffusion Probabilistic Model, CDDPM) を訓練し、未表現のクラスから高品質な合成EHRサンプルを生成する。この合成データを使用して、既存の不均衡なデータセットを増大させ、その結果、すべてのクラスにまたがるよりバランスの取れた分散を実現します。
論文参考訳（メタデータ） (2023-10-27T19:02:22Z)
AUC-mixup: Deep AUC Maximization with Mixup [47.99058341229214]
AUCは正と負のペアで定義されており、ミックスアップデータ拡張をDAMに組み込むことが難しい。我々はAUCマージン損失とソフトラベルを定式化に用いて、ミックスアップによって生成されたデータから効果的に学習する。提案手法が不均衡なベンチマークと医用画像データセットに与える影響を実験的に検証した。
論文参考訳（メタデータ） (2023-10-18T03:43:11Z)
Machine Learning Data Suitability and Performance Testing Using Fault Injection Testing Framework [0.0]
本稿では,入力データ(FIUL-Data)テストフレームワークにおける望ましくない学習のためのフォールトインジェクションを提案する。データミュータは、さまざまな障害注入の影響に対して、MLシステムの脆弱性を探索する。本稿では, アンチセンスオリゴヌクレオチドの保持時間測定を含む分析化学データを用いて, フレームワークの評価を行った。
論文参考訳（メタデータ） (2023-09-20T12:58:35Z)
Graph Embedded Intuitionistic Fuzzy Random Vector Functional Link Neural Network for Class Imbalance Learning [4.069144210024564]
クラス不均衡学習(GE-IFRVFL-CIL)モデルのためのグラフ埋め込み直観的ファジィRVFLを提案する。提案したGE-IFRVFL-CILモデルは、クラス不均衡問題に対処し、ノイズとアウトレーヤの有害な効果を軽減し、データセットの固有の幾何学的構造を保存するための有望な解決策を提供する。
論文参考訳（メタデータ） (2023-07-15T20:45:45Z)
Stochastic Methods for AUC Optimization subject to AUC-based Fairness Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文参考訳（メタデータ） (2022-12-23T22:29:08Z)
Weighted Least Squares Twin Support Vector Machine with Fuzzy Rough Set Theory for Imbalanced Data Classification [0.483420384410068]
サポートベクトルマシン(SVM)は、分類問題を解決するために開発された強力な教師付き学習ツールである。重み付き最小二乗支援ベクトルマシンFRLSTSVMにおけるファジィ粗集合理論を不均衡データの分類に効率的に利用する手法を提案する。
論文参考訳（メタデータ） (2021-05-03T22:33:39Z)
Estimating Average Treatment Effects with Support Vector Machines [77.34726150561087]
サポートベクターマシン(SVM)は、機械学習文献で最も人気のある分類アルゴリズムの1つです。我々はsvmをカーネルベースの重み付け手順として適用し,治療群と制御群の最大平均差を最小化する。このトレードオフから生じる因果効果推定のバイアスを特徴づけ、提案されたSVM手順と既存のカーネルバランシング手法を結びつけます。
論文参考訳（メタデータ） (2021-02-23T20:22:56Z)
Supercharging Imbalanced Data Learning With Energy-based Contrastive Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文参考訳（メタデータ） (2020-11-25T00:13:11Z)
Deep F-measure Maximization for End-to-End Speech Understanding [52.36496114728355]
本稿では,F測度に対する微分可能な近似法を提案し,標準バックプロパゲーションを用いてネットワークをトレーニングする。我々は、アダルト、コミュニティ、犯罪の2つの標準フェアネスデータセットの実験を行い、ATISデータセットの音声・インテリジェンス検出と音声・COCOデータセットの音声・イメージ概念分類を行った。これらの4つのタスクのすべてにおいて、F測定は、クロスエントロピー損失関数で訓練されたモデルと比較して、最大8%の絶対的な絶対的な改善を含む、マイクロF1スコアの改善をもたらす。
論文参考訳（メタデータ） (2020-08-08T03:02:27Z)
Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文参考訳（メタデータ） (2020-06-10T20:20:10Z)
An Investigation of Why Overparameterization Exacerbates Spurious Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文参考訳（メタデータ） (2020-05-09T01:59:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。