論文の概要: Cumulative differences between paired samples
- arxiv url: http://arxiv.org/abs/2305.11323v1
- Date: Thu, 18 May 2023 22:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 17:11:05.042381
- Title: Cumulative differences between paired samples
- Title(参考訳): ペア標本間の累積差
- Authors: Isabel Kloumann, Hannah Korevaar, Chris McConnell, Mark Tygert, and
Jessica Zhao
- Abstract要約: 単純な、最も一般的なペアのサンプルは、2つの集団からの観測から成り立っている。
共変量の同じ値の観察された応答のペア(各集団からの1つ)は「整合対」として知られている。
累積的アプローチは完全に非パラメトリックで一意的に定義される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The simplest, most common paired samples consist of observations from two
populations, with each observed response from one population corresponding to
an observed response from the other population at the same value of an ordinal
covariate. The pair of observed responses (one from each population) at the
same value of the covariate is known as a "matched pair" (with the matching
based on the value of the covariate). A graph of cumulative differences between
the two populations reveals differences in responses as a function of the
covariate. Indeed, the slope of the secant line connecting two points on the
graph becomes the average difference over the wide interval of values of the
covariate between the two points; i.e., slope of the graph is the average
difference in responses. ("Average" refers to the weighted average if the
samples are weighted.) Moreover, a simple statistic known as the Kuiper metric
summarizes into a single scalar the overall differences over all values of the
covariate. The Kuiper metric is the absolute value of the total difference in
responses between the two populations, totaled over the interval of values of
the covariate for which the absolute value of the total is greatest. The total
should be normalized such that it becomes the (weighted) average over all
values of the covariate when the interval over which the total is taken is the
entire range of the covariate (i.e., the sum for the total gets divided by the
total number of observations, if the samples are unweighted, or divided by the
total weight, if the samples are weighted). This cumulative approach is fully
nonparametric and uniquely defined (with only one right way to construct the
graphs and scalar summary statistics), unlike traditional methods such as
reliability diagrams or parametric or semi-parametric regressions, which
typically obscure significant differences due to their parameter settings.
- Abstract(参考訳): 最も単純な、最も一般的なペアのサンプルは、2つの集団からの観測であり、それぞれの観測された応答は、他の集団からの観測された応答に対応する。
共変量の同じ値の観測された応答の対(各集団から1つずつ)は「一致した対」として知られる(同変量の値に基づく一致)。
2つの集団間の累積差のグラフは、共変量関数としての反応の差を示す。
実際、グラフ上の2つの点を結ぶ分離線の傾きは、2つの点の間の共変量の値の広い間隔の平均差、すなわち、グラフの傾きは応答の平均差となる。
(「平均」とは、試料を重み付けした場合の重み付け平均のこと。)
さらに、カイパー計量として知られる単純な統計学は、共変量のすべての値に対する全体的な違いを単一のスカラーにまとめる。
クイパー計量 (kuiper metric) は、2つの集団間の応答の合計差の絶対値であり、総数の絶対値が最も大きい共変量の値の間隔で合計される。
トータルは、トータルが取られる間隔がコ変量の範囲全体である場合、コ変量全体の(重み付け)平均となるように正規化されるべきである(すなわち、トータルの和は、サンプルが重み付けされていない場合、またはトータル重量で割られる場合、トータルの合計は、トータルの観測数で割られる)。
この累積的アプローチは完全に非パラメトリックで一意に定義されており(グラフとスカラーの要約統計を組み立てる正しい方法が1つしかない)、信頼性図やパラメトリックあるいは半パラメトリック回帰のような伝統的な手法とは異なり、パラメータ設定によって典型的に顕著な違いがある。
関連論文リスト
- Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - Controlling for multiple covariates [0.0]
統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
比較は、特定の特徴に応じて類似した個人に対して別々に行う場合に最も理にかなっている。
論文 参考訳(メタデータ) (2021-12-01T17:37:36Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - A graphical method of cumulative differences between two subpopulations [0.0]
本稿では, 比較対象のサブポピュレーションのどのメンバーのスコアも, いずれのサブポピュレーションの他のメンバーのスコアと完全に等しいような共通ケースの手法を開発する。
論文 参考訳(メタデータ) (2021-08-05T14:59:56Z) - Reweighting samples under covariate shift using a Wasserstein distance
criterion [0.0]
両試料の実験的測度間のワッサーシュタイン距離を最小化する最適再重み付けについて検討した。
期待されるワッサーシュタイン距離の一貫性とある程度の収束速度が導出される。
これらの結果は、不確実性定量化を非結合推定に適用し、最近近傍回帰に対する一般化誤差の有界化に適用する。
論文 参考訳(メタデータ) (2020-10-19T07:23:55Z) - Predictive Value Generalization Bounds [27.434419027831044]
本稿では,二項分類の文脈におけるスコアリング関数の評価のためのビクテリオンフレームワークについて検討する。
本研究では,新しい分布自由な大偏差と一様収束境界を導出することにより,予測値に関するスコアリング関数の特性について検討する。
論文 参考訳(メタデータ) (2020-07-09T21:23:28Z) - A Study of Gradient Variance in Deep Learning [56.437755740715396]
階層化サンプリングによる平均ミニバッチ勾配のばらつきを最小化する手法であるグラディエントクラスタリングを導入する。
我々は、一般的なディープラーニングベンチマークの勾配分散を測定し、一般的な仮定に反して、トレーニング中に勾配分散が増加することを観察する。
論文 参考訳(メタデータ) (2020-07-09T03:23:10Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。