論文の概要: A graphical method of cumulative differences between two subpopulations
- arxiv url: http://arxiv.org/abs/2108.02666v3
- Date: Sun, 24 Oct 2021 17:14:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-19 07:15:31.571330
- Title: A graphical method of cumulative differences between two subpopulations
- Title(参考訳): 2つのサブ集団間の累積差のグラフィカルな方法
- Authors: Mark Tygert
- Abstract要約: 本稿では, 比較対象のサブポピュレーションのどのメンバーのスコアも, いずれのサブポピュレーションの他のメンバーのスコアと完全に等しいような共通ケースの手法を開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Comparing the differences in outcomes (that is, in "dependent variables")
between two subpopulations is often most informative when comparing outcomes
only for individuals from the subpopulations who are similar according to
"independent variables." The independent variables are generally known as
"scores," as in propensity scores for matching or as in the probabilities
predicted by statistical or machine-learned models, for example. If the
outcomes are discrete, then some averaging is necessary to reduce the noise
arising from the outcomes varying randomly over those discrete values in the
observed data. The traditional method of averaging is to bin the data according
to the scores and plot the average outcome in each bin against the average
score in the bin. However, such binning can be rather arbitrary and yet greatly
impacts the interpretation of displayed deviation between the subpopulations
and assessment of its statistical significance. Fortunately, such binning is
entirely unnecessary in plots of cumulative differences and in the associated
scalar summary metrics that are analogous to the workhorse statistics of
comparing probability distributions -- those due to Kolmogorov and Smirnov and
their refinements due to Kuiper. The present paper develops such cumulative
methods for the common case in which no score of any member of the
subpopulations being compared is exactly equal to the score of any other member
of either subpopulation.
- Abstract(参考訳): 2つのサブポピュレーション間の結果の違い(つまり「独立変数」)を比較することは、しばしば「独立変数」に類似したサブポピュレーションからのみの結果を比較する際に最も有益である。
独立変数は一般に「スコア」と呼ばれ、例えば、統計モデルや機械学習モデルによって予測される確率やマッチングのための確率スコアとして用いられる。
結果が離散である場合、観測データ内のこれらの離散値に対してランダムに変化する結果から生じるノイズを低減するために平均化が必要である。
従来の平均化方法は、スコアに従ってデータをビン化し、ビンの平均スコアに対して各ビンの平均結果をプロットする。
しかし、そのような結合は比較的任意でありながら、サブポピュレーション間の表示された偏差の解釈と、その統計的意義の評価に大きな影響を及ぼす。
幸いなことに、そのような双対は累積差のプロットや、確率分布の比較の作業統計に類似したスカラー・サマリー・メトリクス(Kolmogorov と Smirnov による)、そしてカイパーによるそれらの改善など、完全に不要である。
本稿では, 比較対象のサブ集団の任意のメンバーのスコアが, いずれのサブ集団の他のメンバーのスコアと正確に等しいような, 共通事例の累積的手法を開発する。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - Mean Estimation with User-level Privacy under Data Heterogeneity [54.07947274508013]
異なるユーザーは、非常に多くの異なるデータポイントを持っているかもしれない。
すべてのユーザが同じディストリビューションからサンプルを採取していると仮定することはできない。
本研究では,データの分布と量の両方でユーザデータが異なる異質なユーザデータの単純なモデルを提案する。
論文 参考訳(メタデータ) (2023-07-28T23:02:39Z) - Cumulative differences between paired samples [0.7237216416830515]
単純な、最も一般的なペアのサンプルは、2つの集団からの観測から成り立っている。
共変量の同じ値の観察された応答のペア(各集団からの1つ)は「整合対」として知られている。
累積的アプローチは完全に非パラメトリックで一意的に定義される。
論文 参考訳(メタデータ) (2023-05-18T22:11:54Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - The role of the geometric mean in case-control studies [4.38301148531795]
結果依存サンプリングにおいて、幾何オッズ比を部分的に同定し、推定し、推測する方法を述べる。
提案した推定器は効率的な影響関数に基づいており、したがって2つの頑健な特性を持つ。
論文 参考訳(メタデータ) (2022-07-19T01:42:52Z) - Controlling for multiple covariates [0.0]
統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
比較は、特定の特徴に応じて類似した個人に対して別々に行う場合に最も理にかなっている。
論文 参考訳(メタデータ) (2021-12-01T17:37:36Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Cumulative deviation of a subpopulation from the full population [0.0]
サブ人口の扱いにおける株式の評価には、全人口のすべての個人に数値的な「スコア」を割り当てることがしばしば必要である。
このようなスコアが与えられた場合、同様のスコアを持つ個人は、サブポピュレーションにおける個人のメンバーシップとは独立して、同様の結果が得られるかもしれないし、得られないかもしれない。
累積プロットは、グラフのセカント線の傾斜線として、サブポピュレーション偏差を直接エンコードする。
論文 参考訳(メタデータ) (2020-08-04T19:30:02Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。