論文の概要: Efficient and Accurate Top-$K$ Recovery from Choice Data
- arxiv url: http://arxiv.org/abs/2206.11995v1
- Date: Thu, 23 Jun 2022 22:05:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 14:21:54.038168
- Title: Efficient and Accurate Top-$K$ Recovery from Choice Data
- Title(参考訳): 選択データからの効率良く正確なトップ$k$リカバリ
- Authors: Duc Nguyen
- Abstract要約: レコメンデーションシステムのようないくつかのアプリケーションでは、統計学者は主に大量のアイテムから上位のアイテムの集合を回収することに興味がある。
そこで本稿では,K$-recoveryの高速かつ高精度なランキングアルゴリズムとして,選択に基づくボルダカウントアルゴリズムを提案する。
選択に基づくボルダカウントアルゴリズムは,多種多様なランダム効用モデルの下で,上位$Kの回収に最適なサンプル複雑性を有することを示す。
- 参考スコア(独自算出の注目度): 1.14219428942199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The intersection of learning to rank and choice modeling is an active area of
research with applications in e-commerce, information retrieval and the social
sciences. In some applications such as recommendation systems, the statistician
is primarily interested in recovering the set of the top ranked items from a
large pool of items as efficiently as possible using passively collected
discrete choice data, i.e., the user picks one item from a set of multiple
items. Motivated by this practical consideration, we propose the choice-based
Borda count algorithm as a fast and accurate ranking algorithm for top
$K$-recovery i.e., correctly identifying all of the top $K$ items. We show that
the choice-based Borda count algorithm has optimal sample complexity for
top-$K$ recovery under a broad class of random utility models. We prove that in
the limit, the choice-based Borda count algorithm produces the same top-$K$
estimate as the commonly used Maximum Likelihood Estimate method but the
former's speed and simplicity brings considerable advantages in practice.
Experiments on both synthetic and real datasets show that the counting
algorithm is competitive with commonly used ranking algorithms in terms of
accuracy while being several orders of magnitude faster.
- Abstract(参考訳): ランクと選択のモデリングへの学習の交わりは、電子商取引、情報検索、社会科学における研究の活発な領域である。
推薦システムなどのいくつかのアプリケーションにおいて、統計学者は、受動的に収集された個別選択データ、すなわち、ユーザが複数のアイテムの集合から1つのアイテムを選択することで、できるだけ効率的に上位項目の集合を回収することに関心がある。
この実践的考察に動機づけられ,上位$k$-recovery,すなわち上位$k$項目を正しく識別する高速かつ正確なランキングアルゴリズムとして,選択に基づくボルダカウントアルゴリズムを提案する。
選択に基づくボルダカウントアルゴリズムは,多種多様なランダム効用モデルの下で,上位$Kの回収に最適なサンプル複雑性を有することを示す。
この限界において、選択に基づくボルダカウントアルゴリズムは、一般的に使用される最大類似度推定法と同じ上位$Kの見積もりを生成するが、前者の速度と単純さは実際にかなりの利点をもたらす。
合成データセットと実データセットの両方の実験により、カウントアルゴリズムは精度の点でよく使われるランキングアルゴリズムと競合し、桁違いに高速であることが示された。
関連論文リスト
- Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - Adaptively Learning to Select-Rank in Online Platforms [34.258659206323664]
本研究は、異種ユーザの候補プールからアイテムを適応的にランク付けすることの課題に対処する。
本研究では,多様なユーザの好みや項目位置の影響を考慮に入れたユーザ応答モデルを構築した。
シミュレーションと実世界の両方のデータセットで実施された実験は、アルゴリズムがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-06-07T15:33:48Z) - Max-Min Diversification with Fairness Constraints: Exact and
Approximation Algorithms [17.57585822765145]
本稿では,小データセットに適した正確なアルゴリズムと,大データセットにスケールする任意の$varepsilon in (0, 1)$に対して$frac1-varepsilon integer 5$-approximationアルゴリズムを提案する。
実世界のデータセットに対する実験は、提案アルゴリズムが既存のデータセットよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-05T13:02:35Z) - HARRIS: Hybrid Ranking and Regression Forests for Algorithm Selection [75.84584400866254]
両アプローチの強みを両アプローチの弱さを緩和しつつ組み合わせ, 特殊林を利用した新しいアルゴリズムセレクタを提案する。
HARRISの決定は、ハイブリッドランキングと回帰損失関数に基づいて最適化された木を作成する森林モデルに基づいている。
論文 参考訳(メタデータ) (2022-10-31T14:06:11Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Test Score Algorithms for Budgeted Stochastic Utility Maximization [12.360522095604983]
既存のスコアリング機構、すなわちレプリケーションテストスコアを拡張して、異種アイテムのコストとアイテムの値を統合する。
我々のアルゴリズムと近似は、テストスコアが特定の期待値のノイズ見積もりであると仮定する。
我々は,我々のアルゴリズムが,同じ近似保証を維持しながら,商品が同じ方法で到着する状況に適応できることを示す。
論文 参考訳(メタデータ) (2020-12-30T15:28:41Z) - Optimizing Revenue while showing Relevant Assortments at Scale [1.0200170217746136]
リアルタイムアソシエーション最適化は、電子商取引業務において欠かせないものとなっている。
我々は、困難な状況下で最適なアソートを見つける高速で柔軟なアルゴリズムを設計する。
実世界のデータセットを用いた実証検証によると、我々のアルゴリズムは、アイテムの数が以前研究されたよりも105$$大きいインスタンスであっても競争力がある。
論文 参考訳(メタデータ) (2020-03-06T20:16:49Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。