論文の概要: Best Group Identification in Multi-Objective Bandits
- arxiv url: http://arxiv.org/abs/2505.17869v1
- Date: Fri, 23 May 2025 13:16:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.099785
- Title: Best Group Identification in Multi-Objective Bandits
- Title(参考訳): 多目的バンドにおけるベストグループ識別
- Authors: Mohammad Shahverdikondori, Mohammad Reza Badri, Negar Kiyavash,
- Abstract要約: マルチオブジェクト・マルチアーム・バンディット・セッティングにおけるベスト・グループ同定問題について述べる。
目的は、固定信頼設定における最適群の集合を特定することである。
本稿では, 除去に基づくアルゴリズムを提案し, サンプルの複雑さの上限を設定し, 正しいアルゴリズムに適用する下限を導出する。
- 参考スコア(独自算出の注目度): 17.056463635480714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce the Best Group Identification problem in a multi-objective multi-armed bandit setting, where an agent interacts with groups of arms with vector-valued rewards. The performance of a group is determined by an efficiency vector which represents the group's best attainable rewards across different dimensions. The objective is to identify the set of optimal groups in the fixed-confidence setting. We investigate two key formulations: group Pareto set identification, where efficiency vectors of optimal groups are Pareto optimal and linear best group identification, where each reward dimension has a known weight and the optimal group maximizes the weighted sum of its efficiency vector's entries. For both settings, we propose elimination-based algorithms, establish upper bounds on their sample complexity, and derive lower bounds that apply to any correct algorithm. Through numerical experiments, we demonstrate the strong empirical performance of the proposed algorithms.
- Abstract(参考訳): エージェントがベクトル値の報酬でアームのグループと相互作用する多目的マルチアームバンディット設定において、ベストグループ同定問題を導入する。
群のパフォーマンスは、異なる次元にわたる群で最も達成可能な報酬を表す効率ベクトルによって決定される。
目的は、固定信頼設定における最適群の集合を特定することである。
最適群の効率ベクトルがパレート最適かつ線形の最適群同定であり、各報酬次元が既知のウェイトを持ち、最適群はその効率ベクトルのエントリーの重み付け和を最大化する。
いずれの設定においても, 除去に基づくアルゴリズムを提案し, サンプルの複雑さの上限を設定し, 正しいアルゴリズムに適用する下限を導出する。
数値実験により,提案アルゴリズムの強い経験的性能を示す。
関連論文リスト
- Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Information-Directed Selection for Top-Two Algorithms [13.339829037245963]
マルチアームバンディットにおける最良のk腕識別問題について考察する。
目的は、測定努力を逐次割当てることにより、最高の平均報酬でk腕の正確なセットを選択することである。
情報ゲインの尺度に基づいて上位2候補の1つを選択する情報指向選択(IDS)を提案する。
論文 参考訳(メタデータ) (2022-05-24T14:07:13Z) - Max-Min Grouped Bandits [48.62520520818357]
マルチアームバンディット問題であるmax-min grouped banditsを導入する。
ゴールは、最悪の腕が最高の平均報酬を持つグループを見つけることです。
この問題はレコメンデーションシステムのようなアプリケーションには関心がある。
論文 参考訳(メタデータ) (2021-11-17T01:59:15Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Exclusive Group Lasso for Structured Variable Selection [10.86544864007391]
構造化変数選択問題を考える。
合成ノルムは、そのような排他的グループ空間パターンを促進するために適切に設計することができる。
構造原子を推定された支持体に含めて解を構築する能動集合アルゴリズムが提案されている。
論文 参考訳(メタデータ) (2021-08-23T16:55:13Z) - Certifiably Polynomial Algorithm for Best Group Subset Selection [0.9667631210393929]
ベストグループサブセットの選択は、応答変数の最良の解釈可能性を達成するために重複しないグループの小さな部分を選択することを目的としている。
有効群を反復的に検出し,無力群を除外するグループスプライシングアルゴリズムを提案する。
提案手法の効率と精度を,合成データセットと実世界のデータセットを比較して検証する。
論文 参考訳(メタデータ) (2021-04-23T03:05:11Z) - Robust subgroup discovery [0.2578242050187029]
最小記述長原理を用いて最適ロバスト部分群発見の問題を定式化する。
RSDは、良いサブグループリストを見つけ、各イテレーションで最も重要なサブグループが追加されたことを保証します。
我々は,rsdが従来のサブグループ集合発見法を上回っている54のデータセットを,品質とサブグループリストサイズの観点から実証的に示す。
論文 参考訳(メタデータ) (2021-03-25T09:04:13Z) - Efficient Pure Exploration for Combinatorial Bandits with Semi-Bandit
Feedback [51.21673420940346]
コンビナーシャルバンディットはマルチアームバンディットを一般化し、エージェントが腕のセットを選択し、選択したセットに含まれる各腕の騒々しい報酬を観察します。
我々は, 最善の腕を一定の信頼度で識別する純粋爆発問題と, 応答集合の構造が動作集合の1つと異なるような, より一般的な設定に注目する。
有限多面体に対するプロジェクションフリーオンライン学習アルゴリズムに基づいて、凸的に最適であり、競争力のある経験的性能を持つ最初の計算効率の良いアルゴリズムである。
論文 参考訳(メタデータ) (2021-01-21T10:35:09Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。
品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。