論文の概要: Clustering Items through Bandit Feedback: Finding the Right Feature out of Many
- arxiv url: http://arxiv.org/abs/2503.11209v1
- Date: Fri, 14 Mar 2025 08:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:09:14.795274
- Title: Clustering Items through Bandit Feedback: Finding the Right Feature out of Many
- Title(参考訳): Bandit Feedbackによるアイテムのクラスタリング:多くの機能の中から適切な機能を見つける
- Authors: Maximilian Graf, Victor Thuot, Nicolas Verzelen,
- Abstract要約: 本稿では,帯域幅フィードバックに基づいて項目集合をクラスタリングする問題について検討する。
そこで我々は,学習者が1つの項目と1つの特徴を選択し,その特徴をうるさく評価する,逐次的かつ適応的な設定について考察する。
逐次Halvingアルゴリズムを利用して,クラスタリングタスクに関連する特徴の探索に依存するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.3927943269211591
- License:
- Abstract: We study the problem of clustering a set of items based on bandit feedback. Each of the $n$ items is characterized by a feature vector, with a possibly large dimension $d$. The items are partitioned into two unknown groups such that items within the same group share the same feature vector. We consider a sequential and adaptive setting in which, at each round, the learner selects one item and one feature, then observes a noisy evaluation of the item's feature. The learner's objective is to recover the correct partition of the items, while keeping the number of observations as small as possible. We provide an algorithm which relies on finding a relevant feature for the clustering task, leveraging the Sequential Halving algorithm. With probability at least $1-\delta$, we obtain an accurate recovery of the partition and derive an upper bound on the budget required. Furthermore, we derive an instance-dependent lower bound, which is tight in some relevant cases.
- Abstract(参考訳): 本稿では,帯域幅フィードバックに基づいて項目集合をクラスタリングする問題について検討する。
それぞれの$n$アイテムは、大きな次元の$d$を持つ特徴ベクトルによって特徴づけられる。
アイテムは、同じグループ内のアイテムが同じ特徴ベクトルを共有するように、2つの未知のグループに分割される。
本稿では,各ラウンドにおいて,学習者が1つの項目と1つの特徴を選択し,その特徴を雑音的に評価する,逐次的適応的な設定について考察する。
学習者の目的は、観測回数を極力小さく保ちながら、アイテムの正しい分割を回復することである。
逐次Halvingアルゴリズムを利用して,クラスタリングタスクに関連する特徴の探索に依存するアルゴリズムを提案する。
少なくとも1-\delta$の確率で、分割を正確に回復し、必要な予算の上限を導出する。
さらに、いくつかの関連するケースでは厳密なインスタンス依存の下位境界を導出する。
関連論文リスト
- Active clustering with bandit feedback [47.131735525178144]
アクティブクラスタリング問題(ACP)について検討する。
学習者は$N$の武器付きバンディットと$d$次元のサブガウスフィードバックで対話する。
同じ群内の腕が同じ平均ベクトルを共有するように、腕をK$グループに隠した分割が存在する。
論文 参考訳(メタデータ) (2024-06-17T12:52:19Z) - Active Preference Learning for Ordering Items In- and Out-of-sample [7.0774164818430565]
アイテムペアを積極的にサンプリングすることで、正確な順序付けを学ぶのに必要なアノテーションの数を減らすことができる。
多くのアルゴリズムはアイテム間の共有構造を無視している。
また、比較におけるノイズがアイテムペア間でどのように変化するかは無視することが一般的である。
論文 参考訳(メタデータ) (2024-05-05T21:44:03Z) - Outlier detection using flexible categorisation and interrogative
agendas [42.321011564731585]
与えられたオブジェクトの集合を分類する方法は、それらを分類するのに使用される機能の集合の選択に依存する。
まず,異なるアジェンダから生じる分類を用いて,外乱検出のための単純な教師なしFCAベースのアルゴリズムを開発する。
次に、重みや質量の異なる特徴の集合として分類する適切なアジェンダを学習するための教師付きメタ学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-19T10:05:09Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Sampling from a $k$-DPP without looking at all items [58.30573872035083]
カーネル関数とサブセットサイズ$k$が与えられた場合、我々のゴールは、サブセットによって誘導されるカーネル行列の行列式に比例する確率を持つ$n$アイテムから$k$をサンプリングすることである(つまり$k$-DPP)。
既存の$k$-DPPサンプリングアルゴリズムは、すべての$n$アイテムを複数回パスする高価な前処理ステップを必要とするため、大規模なデータセットでは利用できない。
そこで我々は, 十分大きなデータの均一なサンプルを適応的に構築し, より小さな$k$のアイテムを効率よく生成するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-06-30T16:40:44Z) - Rethinking Object Detection in Retail Stores [55.359582952686175]
そこで我々はLocountと略される新しいタスク、同時にオブジェクトのローカライゼーションとカウントを提案する。
Locountは、関心のあるオブジェクトのグループをインスタンス数でローカライズするアルゴリズムを必要とする。
大規模オブジェクトのローカライズと数えるデータセットを小売店で収集する。
論文 参考訳(メタデータ) (2020-03-18T14:01:54Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z) - Best-item Learning in Random Utility Models with Subset Choices [40.17224226373741]
我々は、$k$アイテムのサブセットの逐次的かつ適応的に選択されたプレイを用いて、$n$アイテムのプールから最も価値のあるアイテムをPACで学習する問題を考察する。
そのようなRUMの新たな性質を最小限の利点と呼び、アイテムのペアを分離する複雑さを特徴づけるのに役立つ。
一般RUMの学習アルゴリズムとして,アイテムの相対的な数と階層的除去と,新しいPACサンプルの複雑性保証を併用した学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-19T03:57:16Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。