論文の概要: Ensemble pruning via an integer programming approach with diversity
constraints
- arxiv url: http://arxiv.org/abs/2205.01088v1
- Date: Mon, 2 May 2022 17:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 17:12:13.631157
- Title: Ensemble pruning via an integer programming approach with diversity
constraints
- Title(参考訳): 多様性制約付き整数プログラミング手法による組立プルーニング
- Authors: Marcelo Ant\^onio Mendes Bastos, Humberto Brand\~ao C\'esar de
Oliveira, Cristiano Arbex Valle
- Abstract要約: 本稿では、二項分類問題を考察し、最適部分集合を選択する整数プログラミング(IP)アプローチを提案する。
アンサンブルにおける最小の多様性レベルを確保するための制約も提案する。
本手法は, 文学において最もよく使われている刈り取り法と比較して, 競争力のある結果をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensemble learning combines multiple classifiers in the hope of obtaining
better predictive performance. Empirical studies have shown that ensemble
pruning, that is, choosing an appropriate subset of the available classifiers,
can lead to comparable or better predictions than using all classifiers. In
this paper, we consider a binary classification problem and propose an integer
programming (IP) approach for selecting optimal classifier subsets. We propose
a flexible objective function to adapt to desired criteria of different
datasets. We also propose constraints to ensure minimum diversity levels in the
ensemble. Despite the general case of IP being NP-Hard, state-of-the-art
solvers are able to quickly obtain good solutions for datasets with up to 60000
data points. Our approach yields competitive results when compared to some of
the best and most used pruning methods in literature.
- Abstract(参考訳): アンサンブル学習は、より良い予測性能を得るために複数の分類器を組み合わせる。
実験的な研究により、利用可能な分類器の適切なサブセットを選択するアンサンブルプルーニングは、すべての分類器を使用するよりも同等またはより良い予測につながることが示されている。
本稿では、二項分類問題を考察し、最適分類器サブセットを選択する整数プログラミング(IP)手法を提案する。
異なるデータセットの望ましい基準に適応するフレキシブルな客観的関数を提案する。
アンサンブルにおける最小の多様性レベルを確保するための制約も提案する。
IPがNP-Hardである一般的なケースにもかかわらず、最先端の解決者は、最大60000のデータポイントを持つデータセットの優れたソリューションを迅速に得ることができる。
私たちのアプローチは、文学でもっともよく使われる刈り取り方法と比較すると、競争力のある結果をもたらします。
関連論文リスト
- An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Characterizing the Optimal 0-1 Loss for Multi-class Classification with
a Test-time Attacker [57.49330031751386]
我々は,任意の離散データセット上の複数クラス分類器に対するテスト時間攻撃の存在下での損失に対する情報理論的下位境界を求める。
本稿では,データと敵対的制約から競合ハイパーグラフを構築する際に発生する最適0-1損失を求めるための一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-21T15:17:13Z) - An Evolutionary Approach for Creating of Diverse Classifier Ensembles [11.540822622379176]
CIF-Eと呼ばれる4段階のプロトコルに基づく分類器の選択と融合のためのフレームワークを提案する。
我々は,提案したCIF-Eプロトコルに従って,24種類のアンサンブルアプローチを実装し,評価した。
実験により、提案された進化的アプローチは、多くのよく知られたUCIデータセットにおいて最先端の文献的アプローチより優れていることが示された。
論文 参考訳(メタデータ) (2022-08-23T14:23:27Z) - Ensemble Classifier Design Tuned to Dataset Characteristics for Network
Intrusion Detection [0.0]
データセットのクラスオーバーラップ問題に対処する2つの新しいアルゴリズムが提案されている。
提案手法は二進分類と多進分類の両方で評価される。
論文 参考訳(メタデータ) (2022-05-08T21:06:42Z) - Set-valued prediction in hierarchical classification with constrained
representation complexity [4.258263831866309]
階層的多クラス分類問題に焦点をあて、有効集合が階層の内部ノードに対応する。
我々は3つの手法を提案し、それらをベンチマークデータセット上で評価する。
論文 参考訳(メタデータ) (2022-03-13T15:13:19Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Scalable Optimal Classifiers for Adversarial Settings under Uncertainty [10.90668635921398]
本稿では,攻撃者に対して目的が不明な攻撃者がクラス-1データを生成する対角的設定において,最適な分類器を見つけることの問題点を考察する。
この低次元キャラクタリゼーションにより,ほぼほぼ最適な分類器をスケーラブルに計算する訓練手法が開発可能であることを示す。
論文 参考訳(メタデータ) (2021-06-28T13:33:53Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。