論文の概要: Cumulative deviation of a subpopulation from the full population
- arxiv url: http://arxiv.org/abs/2008.01779v5
- Date: Wed, 7 Jul 2021 16:40:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-07 04:13:23.628864
- Title: Cumulative deviation of a subpopulation from the full population
- Title(参考訳): 人口全体からの人口の累積的偏差
- Authors: Mark Tygert
- Abstract要約: サブ人口の扱いにおける株式の評価には、全人口のすべての個人に数値的な「スコア」を割り当てることがしばしば必要である。
このようなスコアが与えられた場合、同様のスコアを持つ個人は、サブポピュレーションにおける個人のメンバーシップとは独立して、同様の結果が得られるかもしれないし、得られないかもしれない。
累積プロットは、グラフのセカント線の傾斜線として、サブポピュレーション偏差を直接エンコードする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Assessing equity in treatment of a subpopulation often involves assigning
numerical "scores" to all individuals in the full population such that similar
individuals get similar scores; matching via propensity scores or appropriate
covariates is common, for example. Given such scores, individuals with similar
scores may or may not attain similar outcomes independent of the individuals'
memberships in the subpopulation. The traditional graphical methods for
visualizing inequities are known as "reliability diagrams" or "calibrations
plots," which bin the scores into a partition of all possible values, and for
each bin plot both the average outcomes for only individuals in the
subpopulation as well as the average outcomes for all individuals; comparing
the graph for the subpopulation with that for the full population gives some
sense of how the averages for the subpopulation deviate from the averages for
the full population. Unfortunately, real data sets contain only finitely many
observations, limiting the usable resolution of the bins, and so the
conventional methods can obscure important variations due to the binning.
Fortunately, plotting cumulative deviation of the subpopulation from the full
population as proposed in this paper sidesteps the problematic coarse binning.
The cumulative plots encode subpopulation deviation directly as the slopes of
secant lines for the graphs. Slope is easy to perceive even when the constant
offsets of the secant lines are irrelevant. The cumulative approach avoids
binning that smooths over deviations of the subpopulation from the full
population. Such cumulative aggregation furnishes both high-resolution
graphical methods and simple scalar summary statistics (analogous to those of
Kuiper and of Kolmogorov and Smirnov used in statistical significance testing
for comparing probability distributions).
- Abstract(参考訳): 亜集団の待遇におけるエクイティの評価は、しばしば、類似した個人が類似のスコアを得るように、全人口の全ての個人に数値的な「スコア」を割り当てることを伴う。
このようなスコアが与えられると、類似したスコアを持つ個人は、亜集団における個人のメンバーとは無関係に同様の結果が得られるか、または得られない。
The traditional graphical methods for visualizing inequities are known as "reliability diagrams" or "calibrations plots," which bin the scores into a partition of all possible values, and for each bin plot both the average outcomes for only individuals in the subpopulation as well as the average outcomes for all individuals; comparing the graph for the subpopulation with that for the full population gives some sense of how the averages for the subpopulation deviate from the averages for the full population.
残念なことに、実際のデータセットは有限個の観測しか持たず、ビンの分解能を制限しているため、従来の手法はビンニングによる重要な変化を曖昧にすることができる。
幸運なことに,本論文で提案するように,全人口から個体群を累積的に逸脱させるプロットは,問題のある粗い二分法を回避している。
累積プロットは、グラフの分離線の傾きとして直接サブポピュレーション偏差を符号化する。
スロープは、セカントラインの一定オフセットが無関係であっても、容易に知覚できる。
累積的なアプローチは、全人口からの亜集団の偏りを緩和する結合を避ける。
このような累積集計は、高分解能なグラフィカル手法と単純なスカラー要約統計(kuiper と kolmogorov と smirnov が確率分布を比較するために統計学的意義試験で使ったものと類似している)の両方を提供する。
関連論文リスト
- Learning With Multi-Group Guarantees For Clusterable Subpopulations [14.042643978487453]
予測問題に対する標準的なデシプラタムは、パフォーマンス保証が人口よりも平均的に維持されるべきである。
しかし、意味のあるサブポピュレーションを構成するものは何だろうか?
個人の分布から自然に現れるクラスターに関して、関連するサブポピュレーションは定義されるべきである。
論文 参考訳(メタデータ) (2024-10-18T16:38:55Z) - Modeling and Forecasting COVID-19 Cases using Latent Subpopulations [8.69240208462227]
新型コロナウイルス感染者数を時間とともにモデル化する2つの新しい方法を提案する。
メソッド#1は辞書ベースのアプローチであり、多くの事前定義されたサブポピュレーションモデルから始まる。
メソッド#2はM$の混合可能な曲線であり、M$、使用するサブポピュレーションの数である$M$は、ユーザによって与えられる。
論文 参考訳(メタデータ) (2023-02-09T18:33:41Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Sequential Community Mode Estimation [7.693649834261879]
本研究では,集団内最大の集団を個体の連続的無作為なサンプリングによって同定する問題について検討する。
この問題に対する新しいアルゴリズムを提案し,解析し,任意のアルゴリズムの下でエラーの確率に関する情報理論の下限を確立する。
論文 参考訳(メタデータ) (2021-11-16T15:05:40Z) - A graphical method of cumulative differences between two subpopulations [0.0]
本稿では, 比較対象のサブポピュレーションのどのメンバーのスコアも, いずれのサブポピュレーションの他のメンバーのスコアと完全に等しいような共通ケースの手法を開発する。
論文 参考訳(メタデータ) (2021-08-05T14:59:56Z) - Selective Classification Can Magnify Disparities Across Groups [89.14499988774985]
選択的分類は平均的精度を向上させることができるが、既存の精度格差を同時に増大させることができる。
禁忌の増大は、一部のグループでのアキュラシーを減少させることもある。
我々は,グループ間で類似のフルカバレッジ精度を実現する分散ロバストモデルを訓練し,選択分類が各グループを均一に改善することを示す。
論文 参考訳(メタデータ) (2020-10-27T08:51:30Z) - Distribution Matching for Crowd Counting [51.90971145453012]
アノテーションにガウスを付与することは一般化性能を損なうことを示す。
我々は,群集CoUNTing (DM-Count) における分布マッチングの利用を提案する。
平均絶対誤差(Mean Absolute Error)の観点では、DM-Countは従来の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-28T04:57:23Z) - Distributionally Robust Losses for Latent Covariate Mixtures [28.407773942857148]
与えられたサイズの全てのサブポピュレーションに対して最悪のケース性能を制御する凸手順を提案する。
我々は, 語彙的類似性, ワイン品質, リシディミズム予測タスクを観察し, 最悪のケースでは, 未知のサブ集団に対して良好に作用するモデルを学習する。
論文 参考訳(メタデータ) (2020-07-28T04:16:27Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - Survival Cluster Analysis [93.50540270973927]
異なるリスクプロファイルを持つサブポピュレーションを特定するために、生存分析には未解決の必要性がある。
このニーズに対処するアプローチは、個々の成果のキャラクタリゼーションを改善する可能性が高い。
論文 参考訳(メタデータ) (2020-02-29T22:41:21Z) - A General Method for Robust Learning from Batches [56.59844655107251]
本稿では,バッチから頑健な学習を行う一般的なフレームワークについて考察し,連続ドメインを含む任意の領域に対する分類と分布推定の限界について考察する。
本手法は,一括分節分類,一括分節,単調,対数凹,ガウス混合分布推定のための,最初の頑健な計算効率の学習アルゴリズムを導出する。
論文 参考訳(メタデータ) (2020-02-25T18:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。