論文の概要: States of Disarray: Cleaning Data for Gerrymandering Analysis
- arxiv url: http://arxiv.org/abs/2503.13521v1
- Date: Fri, 14 Mar 2025 19:33:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 14:16:29.300002
- Title: States of Disarray: Cleaning Data for Gerrymandering Analysis
- Title(参考訳): 乱れの状態:Gerrymandering分析のためのクリーニングデータ
- Authors: Ananya Agarwal, Fnu Alusi, Arbie Hsu, Arif Syraj, Ellen Veomett,
- Abstract要約: 我々は、研究者、学生、一般市民が容易にアクセスし分析できる22の州のデータを作成しました。
提出時点では、研究者、学生、一般市民が容易にアクセスし分析できる22の州のデータがあります。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The mathematics of redistricting is an area of study that has exploded in recent years. In particular, many different research groups and expert witnesses in court cases have used outlier analysis to argue that a proposed map is a gerrymander. This outlier analysis relies on having an ensemble of potential redistricting maps against which the proposed map is compared. Arguably the most widely-accepted method of creating such an ensemble is to use a Markov Chain Monte Carlo (MCMC) process. This process requires that various pieces of data be gathered, cleaned, and coalesced into a single file that can be used as the seed of the MCMC process. In this article, we describe how we have begun this cleaning process for each state, and made the resulting data available for the public at https://github.com/eveomett-states . At the time of submission, we have data for 22 states available for researchers, students, and the general public to easily access and analyze. We will continue the data cleaning process for each state, and we hope that the availability of these datasets will both further research in this area, and increase the public's interest in and understanding of modern techniques to detect gerrymandering.
- Abstract(参考訳): 再制限の数学は近年爆発的な研究領域である。
特に、裁判における多くの異なる研究グループや専門家の目撃者は、提案された地図がゲリーマンダーであると主張するために、外れ値分析を用いてきた。
この不整合解析は、提案された写像を比較した潜在的再限定写像のアンサンブルを持つことに依存している。
このようなアンサンブルを作る最も広く受け入れられている方法は、マルコフ・チェイン・モンテカルロ(MCMC)プロセスを使うことであろう。
このプロセスでは、MCMCプロセスのシードとして使用できる単一のファイルに、さまざまなデータを収集、クリーン化、合体させることが求められます。
本稿では、各状態に対してこのクリーニングプロセスを開始した経緯を説明し、その結果をhttps://github.com/eveomett-statesで公開しました。
提出時点では、研究者、学生、一般市民が容易にアクセスし分析できる22の州のデータがあります。
我々は、各州のデータクリーニングプロセスを継続し、これらのデータセットが利用可能になることで、この分野のさらなる研究と、ジェリーマンディングを検出する現代的な技術に対する人々の関心と理解が高まることを期待します。
関連論文リスト
- Contrast Pattern Mining: A Survey [54.06874773607785]
この分野の研究者が短期間で現場の一般的な状況を理解することは困難である。
まず、識別能力を評価するための基本的な概念、タイプ、採掘戦略、メトリクスを含む、CPMの深い理解を示す。
我々は,CPM法の特徴を,境界ベースアルゴリズム,木ベースアルゴリズム,進化ファジィシステムベースアルゴリズム,決定木ベースアルゴリズム,その他のアルゴリズムに分類する。
論文 参考訳(メタデータ) (2022-09-27T17:11:12Z) - Mathematically Quantifying Non-responsiveness of the 2021 Georgia
Congressional Districting Plan [3.097163558730473]
並列テンパリング法とReComを併用したメトロポリケートサンプリング手法を応用した。
ジョージア州における地区計画の最初の事例研究を通じて、これらの改善を開拓する。
我々の分析では、ジョージア州の選挙は、この制定された計画の下で、確実に9人の共和党員と5人の民主党員を選出すると予想している。
論文 参考訳(メタデータ) (2022-03-13T02:58:32Z) - Implications of Distance over Redistricting Maps: Central and Outlier Maps [10.318010762465939]
代表制民主主義では、各選挙区が代表を選出する地区に分割するために、再分権地図が選択される。
有効な再分級写像は、コンパクトで連続であり、ほぼ同値な集団であるような制約の集合を満たさなければならない。
これにより、党派議会が不公平に有利な地図を選択することで、ジェリーマンダーを許すことができる。
論文 参考訳(メタデータ) (2022-03-02T04:59:30Z) - Measuring Geometric Similarity Across Possible Plans for Automated
Redistricting [0.0]
本稿では,2つの計画の間に同一の選挙区に留まる州の面積や人口の比率に対応する,類似性の解釈的尺度とそれに対応する代入行列を簡潔に紹介する。
次に、直感的な時間でこの測度を計算する方法を示し、潜在的なユースケースを簡潔に示す。
論文 参考訳(メタデータ) (2021-11-17T03:37:25Z) - Compact Redistricting Plans Have Many Spanning Trees [39.779544988993294]
政治的再分権マップの設計と分析において、国勢調査ブロックのグラフのすべての分割の空間から同じ人口の連結部分グラフにサンプリングできることがしばしば有用である。
本稿では,境界分割領域の総長さと,そのような写像がサンプリングされる確率との間には,逆指数関係が成立する。
論文 参考訳(メタデータ) (2021-09-27T23:36:01Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - Sequential Monte Carlo for Sampling Balanced and Compact Redistricting
Plans [0.0]
本稿では,現実的な目標分布に収束する再限定計画のサンプルを生成する,SMC(Sequential Monte Carlo)アルゴリズムを提案する。
提案アルゴリズムの精度を,すべての再分割計画を列挙可能な小さなマップを用いて検証する。
次に、SMCアルゴリズムを用いて、ペンシルベニア州の最近の有名な再分権事件において、関係当事者が提出したいくつかの地図のパルチザン的含意を評価する。
論文 参考訳(メタデータ) (2020-08-13T23:26:34Z) - Learning to Summarize Passages: Mining Passage-Summary Pairs from
Wikipedia Revision Histories [110.54963847339775]
ウィキペディアページのリビジョン履歴をマイニングすることで,パス・トゥ・サマリーデータセットを自動構築する手法を提案する。
特に、本手法では、ページに追加される本体の通路と導入文を同時にマイニングする。
構築されたデータセットは、100万以上のパス・サマー・ペアを含む。
論文 参考訳(メタデータ) (2020-04-06T12:11:50Z) - CNN-based Density Estimation and Crowd Counting: A Survey [65.06491415951193]
本稿では,主にCNNに基づく密度マップ推定法において,群集数モデルについて包括的に検討する。
評価指標から, 観客数データセットで上位3人のパフォーマーを選択した。
我々は、今後のクラウドカウントの展開について、合理的な推測と予測を行うことを期待する。
論文 参考訳(メタデータ) (2020-03-28T13:17:30Z) - NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting and Localization [101.13851473792334]
我々は,5,109枚の画像からなる大規模集束群集NWPU-Crowdを構築し,合計2,133,375個の点と箱を付加したアノテートヘッドを構築した。
他の実世界のデータセットと比較すると、様々な照明シーンを含み、最大密度範囲 (020,033) を持つ。
本稿では,データ特性について述べるとともに,主要なSOTA(State-of-the-art)手法の性能を評価し,新たなデータに生じる問題を分析する。
論文 参考訳(メタデータ) (2020-01-10T09:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。