論文の概要: Learning Preference from Observed Rankings
- arxiv url: http://arxiv.org/abs/2602.16476v1
- Date: Wed, 18 Feb 2026 14:07:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.608054
- Title: Learning Preference from Observed Rankings
- Title(参考訳): 観測されたランキングから学習する
- Authors: Yu-Chang Chen, Chen Chian Fuh, Shang En Tsai,
- Abstract要約: 本稿では,部分的なランキング情報から個人の好みを学習するためのフレキシブルなフレームワークを開発する。
我々は、解釈可能な製品属性、アイテムの固定効果、低ランクのユーザ・イテム・ファクター構造の合計として潜在ユーティリティをモデル化する。
オンラインワイン小売業者からのデータを扱うアプリケーションでは、人気ベースのベンチマークと比較して、サンプル外の推薦性能を向上させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating consumer preferences is central to many problems in economics and marketing. This paper develops a flexible framework for learning individual preferences from partial ranking information by interpreting observed rankings as collections of pairwise comparisons with logistic choice probabilities. We model latent utility as the sum of interpretable product attributes, item fixed effects, and a low-rank user-item factor structure, enabling both interpretability and information sharing across consumers and items. We further correct for selection in which comparisons are observed: a comparison is recorded only if both items enter the consumer's consideration set, inducing exposure bias toward frequently encountered items. We model pair observability as the product of item-level observability propensities and estimate these propensities with a logistic model for the marginal probability that an item is observable. Preference parameters are then estimated by maximizing an inverse-probability-weighted (IPW), ridge-regularized log-likelihood that reweights observed comparisons toward a target comparison population. To scale computation, we propose a stochastic gradient descent (SGD) algorithm based on inverse-probability resampling, which draws comparisons in proportion to their IPW weights. In an application to transaction data from an online wine retailer, the method improves out-of-sample recommendation performance relative to a popularity-based benchmark, with particularly strong gains in predicting purchases of previously unconsumed products.
- Abstract(参考訳): 消費者の嗜好を見積もることは、経済やマーケティングにおける多くの問題の中心である。
本稿では,ロジスティック選択確率とのペアワイズ比較のコレクションとして,観察されたランキングを解釈することで,部分的なランキング情報から個人の選好を学習するための柔軟な枠組みを開発する。
我々は、解釈可能な製品属性、アイテムの固定効果、低ランクのユーザ・イテム・ファクター構造の合計として潜在ユーティリティをモデル化し、消費者やアイテム間での解釈可能性と情報共有を可能にする。
比較は、両項目が消費者の考慮事項に入る場合にのみ記録され、頻繁に遭遇する項目に対する露出バイアスが引き起こされる。
我々は、アイテムレベルの可観測確率の積としてペア可観測性をモデル化し、アイテムが観測可能な限界確率のロジスティックモデルを用いてこれらの可観測性を推定する。
次に、逆確率重み付け (IPW) を最大化することにより、推定パラメータを推定する。
本稿では,逆確率再サンプリングに基づく確率勾配降下(SGD)アルゴリズムを提案する。
オンラインワイン小売業者からのデータを取引するアプリケーションにおいて、この手法は人気ベースのベンチマークと比較してサンプル外推薦性能を向上し、これまで消費されていなかった商品の購入を予想する上で特に大きな利益を上げている。
関連論文リスト
- Reference-Free Rating of LLM Responses via Latent Information [53.463883683503106]
本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。
次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。
ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-29T12:15:52Z) - LLMs for estimating positional bias in logged interaction data [44.839172857330674]
大規模言語モデル(LLM)を用いた位置バイアス推定手法を提案する。
実験の結果, LLM-as-a-judge法で推定した確率は, スコアバケット間で安定であることがわかった。
IPSでトレーニングされたリランカーは、標準のNDCG@10で生産モデルと一致し、重み付けされたNDCG@10を約2%改善した。
論文 参考訳(メタデータ) (2025-09-03T20:26:06Z) - Preference Trajectory Modeling via Flow Matching for Sequential Recommendation [50.077447974294586]
シーケンスレコメンデーションは、履歴的なインタラクションシーケンスに基づいて、各ユーザの次の項目を予測する。
FlowRecはシンプルだが効果的なシーケンシャルレコメンデーションフレームワークである。
我々は,ガウス雑音に代えてパーソナライズされた行動に基づく事前分布を構築し,ユーザの嗜好軌跡をモデル化するためのベクトル場を学習する。
論文 参考訳(メタデータ) (2025-08-25T02:55:42Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Average Adjusted Association: Efficient Estimation with High Dimensional
Confounders [0.0]
平均調整協会(Average Adjusted Association、AAA)は、異種集団における関連を概観した尺度であり、共同設立者のために調整されている。
我々は,AAAの効率的2次/脱バイアス機械学習(DML)推定装置を開発した。
我々のDML推定器は、効率的な影響関数の2つの等価形式を用いており、様々なサンプリングシナリオに適用できる。
論文 参考訳(メタデータ) (2022-05-27T15:36:12Z) - Debiased Explainable Pairwise Ranking from Implicit Feedback [0.3867363075280543]
BPR(Bayesian Personalized Ranking)に焦点をあてる。
BPRはアウトプットを説明しないブラックボックスモデルであり、ユーザのレコメンデーションに対する信頼を制限する。
本稿では,項目に基づく説明とともにレコメンデーションを生成する新しい説明可能な損失関数と,それに対応する行列分解モデルを提案する。
論文 参考訳(メタデータ) (2021-07-30T17:19:37Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Adversarial learning for product recommendation [0.0]
本研究は, 共同分布(ビュー, 購入)行動からサンプルを生成することを学習する条件付き, 結合型生成対向ネットワーク(RecommenderGAN)を提案する。
しかし,本モデルが提案する勧告は,消費者やデジタル小売業者に有効である可能性が示唆された。
論文 参考訳(メタデータ) (2020-07-07T23:35:36Z) - Counterfactual Inference for Consumer Choice Across Many Product
Categories [6.347014958509367]
我々は,行列因数分解の確率論的モデルに基づく機械学習文献に基づく手法を構築した。
我々のモデルは、それぞれのカテゴリを独立して考える従来のモデリングアプローチよりも改善されていることを示す。
保持データを用いて、当社のモデルは、ある製品に対して最も価格に敏感な消費者を正確に識別できることを示す。
論文 参考訳(メタデータ) (2019-06-06T15:11:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。