論文の概要: Novelty Detection for Election Fraud: A Case Study with Agent-Based
Simulation Data
- arxiv url: http://arxiv.org/abs/2211.16023v1
- Date: Tue, 29 Nov 2022 08:46:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 18:08:13.518550
- Title: Novelty Detection for Election Fraud: A Case Study with Agent-Based
Simulation Data
- Title(参考訳): 選挙違反の新規性検出:エージェントによるシミュレーションデータを用いた事例研究
- Authors: Khurram Yamin, Nima Jadali, Dima Nazzal, Yao Xie
- Abstract要約: 不正行為のないクリーンな選挙結果データセットと、不正行為の度合いの異なるデータセットを生成します。
このアルゴリズムは、投票結果の予測結果と実際の選挙結果の類似性を決定する。
シミュレーション手法と機械学習モデルの有効性を両立させ,不正領域の同定に成功した。
- 参考スコア(独自算出の注目度): 6.692240192392746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a robust election simulation model and
independently developed election anomaly detection algorithm that demonstrates
the simulation's utility. The simulation generates artificial elections with
similar properties and trends as elections from the real world, while giving
users control and knowledge over all the important components of the elections.
We generate a clean election results dataset without fraud as well as datasets
with varying degrees of fraud. We then measure how well the algorithm is able
to successfully detect the level of fraud present. The algorithm determines how
similar actual election results are as compared to the predicted results from
polling and a regression model of other regions that have similar demographics.
We use k-means to partition electoral regions into clusters such that
demographic homogeneity is maximized among clusters. We then use a novelty
detection algorithm implemented as a one-class Support Vector Machine where the
clean data is provided in the form of polling predictions and regression
predictions. The regression predictions are built from the actual data in such
a way that the data supervises itself. We show both the effectiveness of the
simulation technique and the machine learning model in its success in
identifying fraudulent regions.
- Abstract(参考訳): 本稿では,ロバストな選挙シミュレーションモデルを提案し,その有用性を示す選挙異常検出アルゴリズムを独立に開発した。
シミュレーションにより,実世界の選挙と類似した特性と傾向を持つ人工選挙が生成され,ユーザーは選挙の重要な要素をすべて制御し,知識を得ることができる。
不正のないクリーンな選挙結果データセットと、不正の度合いの異なるデータセットを生成します。
そして、アルゴリズムが詐欺のレベルをうまく検出できるかどうかを計測する。
このアルゴリズムは、実際の選挙結果とポーリングの予測結果と、同様の人口統計を持つ他の地域の回帰モデルとの類似性を決定する。
k-平均を用いて選挙地域をクラスタに分割し、クラスタ間で人口均質性が最大化される。
次に,一級支援ベクターマシンとして実装された新奇検出アルゴリズムを用いて,ポーリング予測と回帰予測の形式でクリーンなデータを提供する。
回帰予測は、データが自身を監督するように、実際のデータから構築されます。
シミュレーション手法と機械学習モデルの有効性を両立させ,不正領域の同定に成功した。
関連論文リスト
- Design and analysis of tweet-based election models for the 2021 Mexican
legislative election [55.41644538483948]
選挙日前の6ヶ月の間に、1500万件の選挙関連ツイートのデータセットを使用します。
地理的属性を持つデータを用いたモデルが従来のポーリング法よりも精度と精度で選挙結果を決定することがわかった。
論文 参考訳(メタデータ) (2023-01-02T12:40:05Z) - Canary in a Coalmine: Better Membership Inference with Ensembled
Adversarial Queries [53.222218035435006]
私たちは、差別的で多様なクエリを最適化するために、逆ツールを使用します。
我々の改善は既存の方法よりもはるかに正確な会員推定を実現している。
論文 参考訳(メタデータ) (2022-10-19T17:46:50Z) - Credit card fraud detection - Classifier selection strategy [0.0]
アノテーション付きトランザクションのサンプルを使用して、機械学習の分類アルゴリズムは不正を検出することを学習する。
不正データセットは多種多様で 矛盾した特徴を示します
特徴的不均衡な不正検出データセットに対するデータ駆動型分類器選択手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T07:13:42Z) - Expected Frequency Matrices of Elections: Computation, Geometry, and
Preference Learning [58.23459346724491]
我々は、Szufa et al.(AAMAS 2020)の「選挙マップ」アプローチを用いて、よく知られた投票分布を分析します。
分布の「スケルトン写像」を描き、その頑健さを評価し、その性質を分析する。
論文 参考訳(メタデータ) (2022-05-16T17:40:22Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - The Essential Role of Empirical Validation in Legislative Redistricting
Simulation [0.0]
提案手法は,計画の再分割を効率的に行うことのできる計算手法である。
このアルゴリズムは,数百の地理的単位を持つ状態に拡張可能であることを示す。
論文 参考訳(メタデータ) (2020-06-17T20:51:43Z) - A Causal Direction Test for Heterogeneous Populations [10.653162005300608]
ほとんどの因果モデルでは、単一の同質な集団を仮定するが、これは多くの応用において成り立たない仮定である。
等質性仮定に違反した場合、そのような仮定に基づいて開発された因果モデルが正しい因果方向を識別できないことを示す。
我々は,$k$-means型クラスタリングアルゴリズムを用いて,一般的な因果方向検定統計量の調整を提案する。
論文 参考訳(メタデータ) (2020-06-08T18:59:14Z) - Domain Adaptive Bootstrap Aggregating [5.444459446244819]
ブートストラップ集約(英: bootstrap aggregating)は、予測アルゴリズムの安定性を改善する一般的な方法である。
本稿では, ドメイン適応型バッグング手法と, 隣り合う新しい反復型サンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-01-12T20:02:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。