論文の概要: Metric Learning from Limited Pairwise Preference Comparisons
- arxiv url: http://arxiv.org/abs/2403.19629v2
- Date: Fri, 12 Jul 2024 16:56:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 04:57:27.432634
- Title: Metric Learning from Limited Pairwise Preference Comparisons
- Title(参考訳): ペアワイズ選好比較によるメトリックラーニング
- Authors: Zhi Wang, Geelon So, Ramya Korlakai Vinayak,
- Abstract要約: 理想点モデルに基づく選好比較から計量学習を研究する。
一般に、$o(d)$比較は、無限に多くのユーザでさえ、計量に関する情報を示さないことを示す。
- 参考スコア(独自算出の注目度): 6.4930837940388075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study metric learning from preference comparisons under the ideal point model, in which a user prefers an item over another if it is closer to their latent ideal item. These items are embedded into $\mathbb{R}^d$ equipped with an unknown Mahalanobis distance shared across users. While recent work shows that it is possible to simultaneously recover the metric and ideal items given $\mathcal{O}(d)$ pairwise comparisons per user, in practice we often have a limited budget of $o(d)$ comparisons. We study whether the metric can still be recovered, even though it is known that learning individual ideal items is now no longer possible. We show that in general, $o(d)$ comparisons reveal no information about the metric, even with infinitely many users. However, when comparisons are made over items that exhibit low-dimensional structure, each user can contribute to learning the metric restricted to a low-dimensional subspace so that the metric can be jointly identified. We present a divide-and-conquer approach that achieves this, and provide theoretical recovery guarantees and empirical validation.
- Abstract(参考訳): 理想点モデルに基づく選好比較からメートル法学習について検討し、潜在する理想点に近ければ、ある項目を他の項目よりも好んで選択する。
これらのアイテムは、ユーザ間で共有される未知のマハラノビス距離を備えた$\mathbb{R}^d$に埋め込まれる。
最近の研究は、$\mathcal{O}(d)$ペアワイズの比較を1人あたり$\mathcal{O}(d)$で同時に回収できることを示しているが、実際には$o(d)$比較の限られた予算を持つことが多い。
個人理想の項目を学習することはもはや不可能であるにもかかわらず、この指標が依然として回復可能であるかどうかを考察する。
一般に、$o(d)$比較は、無限に多くのユーザでさえ、計量に関する情報を示さないことを示す。
しかし、低次元構造を示す項目を比較した場合、各利用者は低次元部分空間に制限された計量を学習して、計量を共同で識別することができる。
そこで本稿では,この問題を解決し,理論的回復保証と実証的検証を提供する。
関連論文リスト
- Provably Efficient High-Dimensional Bandit Learning with Batched
Feedbacks [93.00280593719513]
本稿では,オンラインインタラクションのT$ステップをバッチに分割したバッチフィードバックによる高次元マルチアームコンテキストバンドレットについて検討する。
具体的には、各バッチは以前のバッチに依存するポリシーに従ってデータを収集し、その報酬はバッチの最後にのみ明らかにする。
我々のアルゴリズムは,$mathcalO( log T)$ バッチで完全に逐次的に設定されたものに匹敵する後悔の限界を達成している。
論文 参考訳(メタデータ) (2023-11-22T06:06:54Z) - SlateFree: a Model-Free Decomposition for Reinforcement Learning with
Slate Actions [5.647516208808729]
逐次的なレコメンデーションの問題を考慮し、各ステップでエージェントがユーザに対して$N$の異なるアイテムのスレートを提案する。
そこで本研究では,SARSAとQ-ラーニングアルゴリズムを新たに提案し,事前のユーザ知識を必要とせず,ステップ毎に$N$の並列反復処理を行う。
論文 参考訳(メタデータ) (2022-09-05T10:15:16Z) - One for All: Simultaneous Metric and Preference Learning over Multiple
Users [17.083305162005136]
回答者の群集からの同時選好とメートル法学習について検討した。
我々のモデルは、群衆のアイテム類似性の一般的な尺度を特徴付ける距離メートル法を共同で学習する。
我々は、シミュレーションデータと色嗜好判定のデータセットの両方で、モデルの性能を実証する。
論文 参考訳(メタデータ) (2022-07-07T22:47:13Z) - Scalable Differentially Private Clustering via Hierarchically Separated
Trees [82.69664595378869]
我々は,最大$O(d3/2log n)cdot OPT + O(k d2 log2 n / epsilon2)$,$epsilon$はプライバシ保証であることを示す。
最悪の場合の保証は、最先端のプライベートクラスタリング手法よりも悪いが、提案するアルゴリズムは実用的である。
論文 参考訳(メタデータ) (2022-06-17T09:24:41Z) - Learning Personalized Item-to-Item Recommendation Metric via Implicit
Feedback [24.37151414523712]
本稿では,暗黙のフィードバックによるメトリクス学習の新しい視点から,レコメンデーションシステムにおける項目間推薦問題について検討する。
本研究では,アイテムの内部コンテンツとユーザによるインタラクションの両方をキャプチャする,パーソナライズ可能なディープメトリックモデルを開発し,検討する。
論文 参考訳(メタデータ) (2022-03-18T18:08:57Z) - Linear Speedup in Personalized Collaborative Learning [69.45124829480106]
フェデレート学習におけるパーソナライゼーションは、モデルのバイアスをトレーディングすることで、モデルの精度を向上させることができる。
ユーザの目的の最適化として、パーソナライズされた協調学習問題を定式化する。
分散の低減のためにバイアスを最適にトレードオフできる条件について検討する。
論文 参考訳(メタデータ) (2021-11-10T22:12:52Z) - FriendlyCore: Practical Differentially Private Aggregation [67.04951703461657]
我々は、制約のない(擬似)計量空間から点の集合を$cal D$として取り出す、単純で実用的なツールである$mathsfFriendlyCore$を提案する。
$cal D$ が有効直径 $r$ を持つとき、$mathsfFriendlyCore$ はすべての点を含む "stable" サブセット $cal D_Gsubseteq cal D$ を返す。
$mathsfFriendlyCore$は、プライベートに集約する前に入力を前処理するために使用することができる。
論文 参考訳(メタデータ) (2021-10-19T17:43:50Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - Simultaneous Preference and Metric Learning from Paired Comparisons [21.76333373051043]
本稿では,距離計量が未知のマハラノビス計量である場合に,ユーザの嗜好の理想的な点表現を学習する問題を考察する。
我々は「item $mathbfx_i$ is preferred to item $mathbfx_j$」という形式のペア比較から、ユーザの理想的な点 $mathbfu$ と Mahalanobis メトリックを推定する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-04T16:59:35Z) - Positive semidefinite support vector regression metric learning [0.0]
これらのシナリオにおけるメートル法学習問題に対処するためにRAMLフレームワークが提案されている。
計量学習に必要な正の半定距離メートル法を学習することはできない。
弱さを克服するために2つのメソドを提案する。
論文 参考訳(メタデータ) (2020-08-18T04:45:59Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。