論文の概要: Adaptive Algorithms for Relaxed Pareto Set Identification
- arxiv url: http://arxiv.org/abs/2307.00424v1
- Date: Sat, 1 Jul 2023 20:43:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 16:17:02.485315
- Title: Adaptive Algorithms for Relaxed Pareto Set Identification
- Title(参考訳): Relaxed Pareto Set Identificationのための適応アルゴリズム
- Authors: Cyrille Kone, Emilie Kaufmann, Laura Richert
- Abstract要約: 多目的多武装バンディットモデルにおけるパレート最適セットの固定信頼度同定を再検討する。
そこで我々は,Adaptive Pareto Exploration (Adaptive Pareto Exploration) と呼ばれる単一サンプリング手法を提案する。
我々はこれらの組み合わせのサンプルの複雑さを分析し、特にサンプルの複雑さの減少を定量化する。
- 参考スコア(独自算出の注目度): 11.288403109735544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we revisit the fixed-confidence identification of the Pareto
optimal set in a multi-objective multi-armed bandit model. As the sample
complexity to identify the exact Pareto set can be very large, a relaxation
allowing to output some additional near-optimal arms has been studied. In this
work we also tackle alternative relaxations that allow instead to identify a
relevant subset of the Pareto set. Notably, we propose a single sampling
strategy, called Adaptive Pareto Exploration, that can be used in conjunction
with different stopping rules to take into account different relaxations of the
Pareto Set Identification problem. We analyze the sample complexity of these
different combinations, quantifying in particular the reduction in sample
complexity that occurs when one seeks to identify at most $k$ Pareto optimal
arms. We showcase the good practical performance of Adaptive Pareto Exploration
on a real-world scenario, in which we adaptively explore several vaccination
strategies against Covid-19 in order to find the optimal ones when multiple
immunogenicity criteria are taken into account.
- Abstract(参考訳): 本稿では,多目的多目的バンディットモデルにおけるパレート最適集合の固定信頼度同定を再考する。
正確なパレート集合を同定するサンプルの複雑さは非常に大きいため、さらなる準最適腕を出力できる緩和法が研究されている。
この研究では、代わりにパレート集合の関連する部分集合を特定できる代替緩和にも取り組みます。
特に,pareto集合同定問題の異なる緩和を考慮に入れるために,異なる停止規則とともに使用できる適応パレート探索と呼ばれる単一サンプリング戦略を提案する。
これらの組み合わせのサンプルの複雑さを分析し、特にパレートの最適アームを最大$kで識別しようとすると生じるサンプルの複雑さの減少を定量化する。
複数の免疫原性基準を考慮に入れた場合に最適なものを見つけるために、Covid-19に対するいくつかの予防接種戦略を適応的に探求する現実のシナリオにおいて、Adaptive Pareto Explorationの優れた実用性能を示す。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Learning the Pareto Front Using Bootstrapped Observation Samples [17.519167857253404]
本研究では,非支配的な平均報酬ベクトルを持つアームの集合を同定するアルゴリズムを提案する。
提案アルゴリズムのサンプル複雑性は対数係数まで最適である。
主要なコントリビューションは、新しい推定器で、ラウンド毎に、未知のパラメータの見積もりを複数のコンテキスト方向に沿って更新する。
論文 参考訳(メタデータ) (2023-05-31T18:15:09Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - Pareto Regret Analyses in Multi-objective Multi-armed Bandit [22.17126026244685]
多目的多武装バンディットの最適性について検討する。
我々は,多目的多目的バンディット設定の事前情報と不要情報の両方を仮定する新しいアルゴリズムを提案する。
アルゴリズムは、対数設定において最適であり、同時に設定において対数係数までほぼ最適である。
論文 参考訳(メタデータ) (2022-12-01T21:44:27Z) - On-Demand Sampling: Learning Optimally from Multiple Distributions [63.20009081099896]
社会と現実世界の考察は、マルチディストリビューション学習パラダイムの台頭につながっている。
これらの学習パラダイムの最適なサンプル複雑性を確立し、このサンプル複雑性を満たすアルゴリズムを提供する。
アルゴリズムの設計と解析は,ゼロサムゲーム解決のためのオンライン学習手法の拡張によって実現されている。
論文 参考訳(メタデータ) (2022-10-22T19:07:26Z) - Pareto Set Learning for Expensive Multi-Objective Optimization [5.419608513284392]
膨大な多目的最適化問題は、多くの現実世界のアプリケーションで見られる。
本稿では,MOBOのパレート集合全体を近似する学習に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-10-16T09:41:54Z) - Pareto Navigation Gradient Descent: a First-Order Algorithm for
Optimization in Pareto Set [17.617944390196286]
マルチタスク学習のような現代の機械学習アプリケーションは、複数の目的関数をトレードオフするために最適なモデルパラメータを見つける必要がある。
勾配情報のみを用いてOPT-in-Paretoを近似的に解く1次アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-17T04:07:04Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。