論文の概要: Cumulative differences between paired samples
- arxiv url: http://arxiv.org/abs/2305.11323v2
- Date: Mon, 8 Apr 2024 15:25:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 05:27:02.478428
- Title: Cumulative differences between paired samples
- Title(参考訳): ペア試料の累積差
- Authors: Isabel Kloumann, Hannah Korevaar, Chris McConnell, Mark Tygert, Jessica Zhao,
- Abstract要約: 単純な、最も一般的なペアのサンプルは、2つの集団からの観測から成り立っている。
共変量の同じ値の観察された応答のペア(各集団からの1つ)は「整合対」として知られている。
累積的アプローチは完全に非パラメトリックで一意的に定義される。
- 参考スコア(独自算出の注目度): 0.7237216416830515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The simplest, most common paired samples consist of observations from two populations, with each observed response from one population corresponding to an observed response from the other population at the same value of an ordinal covariate. The pair of observed responses (one from each population) at the same value of the covariate is known as a "matched pair" (with the matching based on the value of the covariate). A graph of cumulative differences between the two populations reveals differences in responses as a function of the covariate. Indeed, the slope of the secant line connecting two points on the graph becomes the average difference over the wide interval of values of the covariate between the two points; i.e., slope of the graph is the average difference in responses. ("Average" refers to the weighted average if the samples are weighted.) Moreover, a simple statistic known as the Kuiper metric summarizes into a single scalar the overall differences over all values of the covariate. The Kuiper metric is the absolute value of the total difference in responses between the two populations, totaled over the interval of values of the covariate for which the absolute value of the total is greatest. The total should be normalized such that it becomes the (weighted) average over all values of the covariate when the interval over which the total is taken is the entire range of the covariate (i.e., the sum for the total gets divided by the total number of observations, if the samples are unweighted, or divided by the total weight, if the samples are weighted). This cumulative approach is fully nonparametric and uniquely defined (with only one right way to construct the graphs and scalar summary statistics), unlike traditional methods such as reliability diagrams or parametric or semi-parametric regressions, which typically obscure significant differences due to their parameter settings.
- Abstract(参考訳): 最も単純な、最も一般的なペアのサンプルは2つの個体群からの観測であり、それぞれが1つの個体群から観察された反応は、他の個体群からの観察された反応に対応する。
共変量の同じ値の観測された応答(各集団の1つ)のペアは、(共変量の値に基づくマッチング)「マッチングペア」として知られている。
2つの集団間の累積差のグラフは、共変量の関数としての応答の差を明らかにする。
実際、グラフ上の2つの点を接続するセカント線の傾斜は、この2つの点の間の共変量の幅の広い値の平均差となる。
(「平均」とは、試料を重み付けした場合の重み付け平均のこと。)
さらに、カイパー計量として知られる単純な統計学は、共変量のすべての値に対する全体的な違いを1つのスカラーにまとめる。
カイパー計量(Kuiper metric)は、2つの集団間の反応の総和の絶対値であり、総和の絶対値が最大となる共変量の値の間隔で合計される。
合計は、合計が余変数のすべての値に対して(重み付けされた)平均となるように正規化されるべきである(つまり、合計の合計は、サンプルが重み付けされていない場合、または、サンプルが重み付けされている場合、総重量で割られる)。
この累積的アプローチは完全に非パラメトリックで一意に定義されており(グラフの構築とスカラー要約統計の正しい1つの方法しか持たない)、信頼性図やパラメトリックあるいは半パラメトリック回帰のような伝統的な手法とは異なり、パラメータ設定によって典型的には顕著な違いがある。
関連論文リスト
- Gower's similarity coefficients with automatic weight selection [0.0]
混合型変数に対する最も一般的な相似性は、ゴーワーの類似性係数の1つを補うものとして導かれる。
重み付けスキームに関する議論は、しばしば非重み付けの「標準」設定が全体の相似性に対する単一の変数の不均衡な寄与を隠すことを無視するので、誤解を招くことがある。
この欠点は、各寄与相違性と結果の重み付け相違との相関関係を最小化する重み付けスキームを導入するという最近の考え方に倣って解決される。
論文 参考訳(メタデータ) (2024-01-30T14:21:56Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - Controlling for multiple covariates [0.0]
統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
比較は、特定の特徴に応じて類似した個人に対して別々に行う場合に最も理にかなっている。
論文 参考訳(メタデータ) (2021-12-01T17:37:36Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - A graphical method of cumulative differences between two subpopulations [0.0]
本稿では, 比較対象のサブポピュレーションのどのメンバーのスコアも, いずれのサブポピュレーションの他のメンバーのスコアと完全に等しいような共通ケースの手法を開発する。
論文 参考訳(メタデータ) (2021-08-05T14:59:56Z) - Reweighting samples under covariate shift using a Wasserstein distance
criterion [0.0]
両試料の実験的測度間のワッサーシュタイン距離を最小化する最適再重み付けについて検討した。
期待されるワッサーシュタイン距離の一貫性とある程度の収束速度が導出される。
これらの結果は、不確実性定量化を非結合推定に適用し、最近近傍回帰に対する一般化誤差の有界化に適用する。
論文 参考訳(メタデータ) (2020-10-19T07:23:55Z) - Predictive Value Generalization Bounds [27.434419027831044]
本稿では,二項分類の文脈におけるスコアリング関数の評価のためのビクテリオンフレームワークについて検討する。
本研究では,新しい分布自由な大偏差と一様収束境界を導出することにより,予測値に関するスコアリング関数の特性について検討する。
論文 参考訳(メタデータ) (2020-07-09T21:23:28Z) - A Study of Gradient Variance in Deep Learning [56.437755740715396]
階層化サンプリングによる平均ミニバッチ勾配のばらつきを最小化する手法であるグラディエントクラスタリングを導入する。
我々は、一般的なディープラーニングベンチマークの勾配分散を測定し、一般的な仮定に反して、トレーニング中に勾配分散が増加することを観察する。
論文 参考訳(メタデータ) (2020-07-09T03:23:10Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。