論文の概要: Uncertainty Quantification of MLE for Entity Ranking with Covariates
- arxiv url: http://arxiv.org/abs/2212.09961v1
- Date: Tue, 20 Dec 2022 02:28:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 14:55:44.748005
- Title: Uncertainty Quantification of MLE for Entity Ranking with Covariates
- Title(参考訳): 共変量付きエンティティランキングのためのmleの不確実性定量化
- Authors: Jianqing Fan, Jikai Hou, Mengxin Yu
- Abstract要約: 本稿では,ペア比較に基づくランキング問題の統計的推定と推定について検討する。
我々は、有名なBradley-Terry-Luceモデルを拡張した新しいモデルCAREモデルを提案する。
我々は、スパース比較グラフの下で、$alpha_i*_i=1n$と$beta*$の最大確率推定器を導出する。
大規模数値研究による理論結果の検証と相互資金保有データセットへの適用について検討する。
- 参考スコア(独自算出の注目度): 0.49416305961918056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper concerns with statistical estimation and inference for the ranking
problems based on pairwise comparisons with additional covariate information
such as the attributes of the compared items. Despite extensive studies, few
prior literatures investigate this problem under the more realistic setting
where covariate information exists. To tackle this issue, we propose a novel
model, Covariate-Assisted Ranking Estimation (CARE) model, that extends the
well-known Bradley-Terry-Luce (BTL) model, by incorporating the covariate
information. Specifically, instead of assuming every compared item has a fixed
latent score $\{\theta_i^*\}_{i=1}^n$, we assume the underlying scores are
given by $\{\alpha_i^*+{x}_i^\top\beta^*\}_{i=1}^n$, where $\alpha_i^*$ and
${x}_i^\top\beta^*$ represent latent baseline and covariate score of the $i$-th
item, respectively. We impose natural identifiability conditions and derive the
$\ell_{\infty}$- and $\ell_2$-optimal rates for the maximum likelihood
estimator of $\{\alpha_i^*\}_{i=1}^{n}$ and $\beta^*$ under a sparse comparison
graph, using a novel `leave-one-out' technique (Chen et al., 2019) . To conduct
statistical inferences, we further derive asymptotic distributions for the MLE
of $\{\alpha_i^*\}_{i=1}^n$ and $\beta^*$ with minimal sample complexity. This
allows us to answer the question whether some covariates have any explanation
power for latent scores and to threshold some sparse parameters to improve the
ranking performance. We improve the approximation method used in (Gao et al.,
2021) for the BLT model and generalize it to the CARE model. Moreover, we
validate our theoretical results through large-scale numerical studies and an
application to the mutual fund stock holding dataset.
- Abstract(参考訳): 本稿では,比較項目の属性などの余分な共変量情報とのペア比較に基づいて,ランキング問題の統計的推定と推定を行う。
広範な研究にもかかわらず、共変量情報が存在するより現実的な環境下でこの問題を研究する以前の文献は少ない。
この問題に対処するために,共変量情報を統合することで,有名なBradley-Terry-Luce(BTL)モデルを拡張した新しいモデルCARE(Covariate-Assisted Ranking Estimation)モデルを提案する。
具体的には、すべての比較項目が固定された潜在スコア $\{\theta_i^*\}_{i=1}^n$ を持つと仮定するのではなく、基礎となるスコアは$\{\alpha_i^*+{x}_i^\top\beta^*\}_{i=1}^n$ で与えられると仮定する。
我々は、新しい「リーブ・ワン・アウト」手法(chen et al., 2019)を用いて、スパース比較グラフの下で、自然同一性条件を課し、$\{\alpha_i^*\}_{i=1}^{n}$と$\beta^*$の最大推定値に対して$\ell_{\infty}$-および$\ell_2$-optimal rateを導出する。
統計的推論を行うために、より最小のサンプル複雑性を持つ$\{\alpha_i^*\}_{i=1}^n$および$\beta^*$のMLEに対する漸近分布を導出する。
これにより、ある共変量体が潜在スコアの説明力を持っているかどうかを問うことができ、いくつかのスパースパラメータをしきい値としてランク付け性能を改善することができる。
我々は,BLTモデルにおいて (Gao et al., 2021) で用いられる近似法を改善し, CAREモデルに一般化する。
さらに, 大規模数値研究を通じて理論結果を検証し, 相互資金保有データセットへの適用を行った。
関連論文リスト
- TIC-TAC: A Framework To Learn And Evaluate Your Covariance [119.82937345718378]
State-of-the-art method predict the mean $f_theta(x)$ and covariance $textrmCov(f_theta(x))$ of the target distribution through the two neural network using the negative log-likelihood。
1)予測共分散は予測平均のランダム性を真に捉えているのか?
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Sparse Gaussian Graphical Models with Discrete Optimization:
Computational and Statistical Perspectives [8.403841349300103]
本研究では,無向ガウス図形モデルに基づくスパースグラフの学習問題を考察する。
擬似微分関数の $ell_0$-penalized バージョンに基づく新しい推定器 GraphL0BnB を提案する。
実/合成データセットに関する数値実験により,本手法がほぼ最適に,p = 104$の問題を解けることが示唆された。
論文 参考訳(メタデータ) (2023-07-18T15:49:02Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - The Projected Covariance Measure for assumption-lean variable
significance testing [4.2534846356464815]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。
条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。
本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-03T17:55:50Z) - Statistical Inference of Constrained Stochastic Optimization via
Sketched Sequential Quadratic Programming [59.36379287247961]
この問題を解決するために,完全オンライン逐次2次プログラミング(StoSQP)手法を開発した。
最近の数値二階法の設計により、StoSQPは任意のランダムなステップサイズを適応的に選択できる。
また,2次法の計算コストを大幅に削減するため,StoSQPはランダム化反復解法を用いて2次プログラムを不正確に解けるようにした。
論文 参考訳(メタデータ) (2022-05-27T00:34:03Z) - The Performance of the MLE in the Bradley-Terry-Luce Model in
$\ell_{\infty}$-Loss and under General Graph Topologies [76.61051540383494]
我々はBradley-Terry-Luceモデルの$ell_infty$推定誤差に関する新しい一般上限を導出する。
導出された境界は良好に機能し、場合によっては既知の結果よりもシャープであることを示す。
論文 参考訳(メタデータ) (2021-10-20T23:46:35Z) - Dynamic Ranking with the BTL Model: A Nearest Neighbor based Rank
Centrality Method [5.025654873456756]
静的設定から動的設定への古典的BTL(Bradley-Terry-Luce)モデルの拡張について検討する。
我々は mathbbRn$ のアイテム $w_t* の潜在強度をいつでも回復することを目指している。
また、実データおよび合成データに関する実験で理論解析を補完する。
論文 参考訳(メタデータ) (2021-09-28T14:01:40Z) - Outlier-robust sparse/low-rank least-squares regression and robust
matrix completion [1.0878040851637998]
ヘテロジニアス雑音を伴う統計的学習フレームワークにおける高次元最小二乗回帰について検討する。
また, 製品プロセスの新たな応用に基づいて, 行列分解を伴う新しいトレーサリグレス理論を提案する。
論文 参考訳(メタデータ) (2020-12-12T07:42:47Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - Computationally and Statistically Efficient Truncated Regression [36.3677715543994]
計算的かつ統計的に効率的な線形回帰の古典的問題に対する推定器を提供する。
提案手法では, トランキャット標本の負の対数類似度に代わることなく, プロジェクテッド・Descent Gradient (PSGD) を用いて推定する。
本稿では,SGDが単一層ニューラルネットワークの雑音活性化関数のパラメータを学習することを示す。
論文 参考訳(メタデータ) (2020-10-22T19:31:30Z) - Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal
Sample Complexity [67.02490430380415]
モデルに基づくMARLは、Nash平衡値(NE)を求めるために$tilde O(|S||B|(gamma)-3epsilon-2)$のサンプル複雑性を実現する。
また、アルゴリズムが報酬に依存しない場合、そのようなサンプル境界は最小値(対数因子まで)であり、アルゴリズムは報酬知識のない遷移サンプルを問合せする。
論文 参考訳(メタデータ) (2020-07-15T03:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。