論文の概要: New Bounds on the Accuracy of Majority Voting for Multi-Class
Classification
- arxiv url: http://arxiv.org/abs/2309.09564v1
- Date: Mon, 18 Sep 2023 08:16:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 14:33:19.512757
- Title: New Bounds on the Accuracy of Majority Voting for Multi-Class
Classification
- Title(参考訳): 複数クラス分類における多数投票の精度に関する新しい知見
- Authors: Sina Aeeneh, Nikola Zlatanov, Jiangshan Yu
- Abstract要約: 一般的な多クラス分類問題に対するMVFの精度は未だ不明である。
一定の条件下では、MVFの誤差率は、独立投票者の数が増えるにつれて指数関数的にゼロに低下する。
次に、真理発見アルゴリズムの精度について論じる。
- 参考スコア(独自算出の注目度): 5.95012663623095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Majority voting is a simple mathematical function that returns the value that
appears most often in a set. As a popular decision fusion technique, the
majority voting function (MVF) finds applications in resolving conflicts, where
a number of independent voters report their opinions on a classification
problem. Despite its importance and its various applications in ensemble
learning, data crowd-sourcing, remote sensing, and data oracles for
blockchains, the accuracy of the MVF for the general multi-class classification
problem has remained unknown. In this paper, we derive a new upper bound on the
accuracy of the MVF for the multi-class classification problem. More
specifically, we show that under certain conditions, the error rate of the MVF
exponentially decays toward zero as the number of independent voters increases.
Conversely, the error rate of the MVF exponentially grows with the number of
independent voters if these conditions are not met.
We first explore the problem for independent and identically distributed
voters where we assume that every voter follows the same conditional
probability distribution of voting for different classes, given the true
classification of the data point. Next, we extend our results for the case
where the voters are independent but non-identically distributed. Using the
derived results, we then provide a discussion on the accuracy of the truth
discovery algorithms. We show that in the best-case scenarios, truth discovery
algorithms operate as an amplified MVF and thereby achieve a small error rate
only when the MVF achieves a small error rate, and vice versa, achieve a large
error rate when the MVF also achieves a large error rate. In the worst-case
scenario, the truth discovery algorithms may achieve a higher error rate than
the MVF. Finally, we confirm our theoretical results using numerical
simulations.
- Abstract(参考訳): 多数決は、集合の中で最も頻繁に現れる値を返す単純な数学的関数である。
人気の高い意思決定融合手法として、多数決関数 (MVF) は紛争解決の応用を見つけ、多くの独立した有権者が分類問題について意見を述べる。
その重要性と、アンサンブル学習、データクラウドソーシング、リモートセンシング、ブロックチェーンのデータオラクルにおける様々な応用にもかかわらず、一般的なマルチクラス分類問題に対するmvfの精度は未知のままである。
本稿では,マルチクラス分類問題に対するmvfの精度に関する新たな上限を導出する。
より具体的には、ある条件下では、独立投票者の数が増加するにつれて、MVFの誤差率は指数関数的にゼロに低下する。
逆に、MVFの誤差率は、これらの条件が満たされない場合、独立投票者の数とともに指数関数的に増加する。
まず、データポイントの真の分類を考えると、各投票者が異なるクラスに対する投票の条件付き確率分布に従うと仮定して、独立で同一に分布する有権者の問題を考察する。
次に、有権者が独立しているが、特定されていない場合の結果を拡張する。
得られた結果を用いて,真理探索アルゴリズムの精度について考察する。
最良ケースでは、真理発見アルゴリズムが増幅されたMVFとして動作し、MVFが小さなエラー率を達成した場合にのみ小さなエラー率を達成することを示し、また、MVFが大きなエラー率を達成した場合にも大きなエラー率を達成することを示す。
最悪のシナリオでは、真理発見アルゴリズムはMVFよりも高いエラー率を達成する可能性がある。
最後に,数値シミュレーションにより理論的結果を確認する。
関連論文リスト
- NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models [70.02816541347251]
本稿では,注意基準の未適用ポテンシャルを利用して,事実の精度を高める軽量なノム投票法(Nom Voting, NoVo)を提案する。
TruthfulQA MC1では、NoVoは現在の最先端および過去のすべてのメソッドを、驚くべきマージン -- 少なくとも19の精度ポイントで上回る。
論文 参考訳(メタデータ) (2024-10-11T16:40:03Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Anomaly Detection Under Uncertainty Using Distributionally Robust
Optimization Approach [0.9217021281095907]
異常検出は、大多数のパターンに従わないデータポイントを見つける問題として定義される。
1クラスのサポートベクトルマシン(SVM)メソッドは、通常のデータポイントと異常を区別するための決定境界を見つけることを目的としている。
誤分類の確率が低い分布的に頑健な確率制約モデルを提案する。
論文 参考訳(メタデータ) (2023-12-03T06:13:22Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Data as voters: instance selection using approval-based multi-winner voting [1.597617022056624]
機械学習(あるいはデータマイニング)におけるインスタンス選択問題に対する新しいアプローチを提案する。
私たちのモデルでは、インスタンスは有権者と候補者として二重の役割を担います。
SVM では,EJR や PJR を満たすいくつかの投票規則を用いて,平均精度をわずかに向上させた。
論文 参考訳(メタデータ) (2023-04-19T22:00:23Z) - Fairly Allocating Utility in Constrained Multiwinner Elections [0.0]
このような文脈にまたがる公平性を保証する一般的な分母は、制約の使用である。
これらの状況の中で、与えられた制約を満たすために選ばれた候補者は、歴史的に不利な有権者の集団に対して、体系的に不公平な結果をもたらす可能性がある。
投票者間の制約を公平に満たす候補を選択するモデルを構築した。
論文 参考訳(メタデータ) (2022-11-23T10:04:26Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Learning Stochastic Majority Votes by Minimizing a PAC-Bayes
Generalization Bound [15.557653926558638]
分類器の有限アンサンブルに対する多数票の対について検討し、その一般化特性について検討する。
ディリクレ分布でインスタンス化し、予測されるリスクに対して閉じた形式と微分可能な表現を可能にする。
結果の多数決学習アルゴリズムは、最先端の精度と(非空きな)厳密な境界から恩恵を得る。
論文 参考訳(メタデータ) (2021-06-23T16:57:23Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。