論文の概要: Active Ranking of Experts Based on their Performances in Many Tasks
- arxiv url: http://arxiv.org/abs/2306.02628v1
- Date: Mon, 5 Jun 2023 06:55:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 16:28:49.088658
- Title: Active Ranking of Experts Based on their Performances in Many Tasks
- Title(参考訳): 各種業務における実績に基づく専門家の能動的ランキング
- Authors: El Mehdi Saad (MISTEA), Nicolas Verzelen (MISTEA), Alexandra
Carpentier
- Abstract要約: 我々は、dタスクのパフォーマンスに基づいて、n名のエキスパートをランク付けする問題を考察する。
我々は,各専門家のペアに対して,各タスクにおいて他方よりも優れているという,単調な仮定を定めている。
- 参考スコア(独自算出の注目度): 72.96112117037465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of ranking n experts based on their performances on d
tasks. We make a monotonicity assumption stating that for each pair of experts,
one outperforms the other on all tasks. We consider the sequential setting
where in each round, the learner has access to noisy evaluations of actively
chosen pair of expert-task, given the information available up to the actual
round. Given a confidence parameter $\delta$ $\in$ (0, 1), we provide
strategies allowing to recover the correct ranking of experts and develop a
bound on the total number of queries made by our algorithm that hold with
probability at least 1 -- $\delta$. We show that our strategy is adaptive to
the complexity of the problem (our bounds are instance dependent), and develop
matching lower bounds up to a poly-logarithmic factor. Finally, we adapt our
strategy to the relaxed problem of best expert identification and provide
numerical simulation consistent with our theoretical results.
- Abstract(参考訳): 我々は、dタスクのパフォーマンスに基づいて、n名のエキスパートをランク付けする問題を考察する。
それぞれの専門家に対して、各タスクにおいて他方よりも優れているという単調な仮定を立てる。
我々は,各ラウンドの学習者が,実際のラウンドまでの情報を考慮し,アクティブに選択された一対のエキスパート・タスクのノイズ評価にアクセスできるようなシーケンシャルな設定を考える。
信頼度パラメータ $\delta$$$\in$ (0, 1) が与えられると、我々は専門家の正しいランキングを回復し、少なくとも1 -- $\delta$という確率で保持するアルゴリズムによってなされるクエリの総数に制限を付ける戦略を提供する。
我々の戦略は問題の複雑さに適応し(我々の境界はインスタンスに依存している)、対応する下界を多対数因子まで発展させることが示される。
最後に, 最適専門家識別の緩和問題に戦略を適応させ, 理論的結果に整合した数値シミュレーションを行う。
関連論文リスト
- Inverse Reinforcement Learning with Sub-optimal Experts [56.553106680769474]
与えられた専門家の集合と互換性のある報酬関数のクラスの理論的性質について検討する。
以上の結果から,複数の準最適専門家の存在が,相反する報酬の集合を著しく減少させる可能性が示唆された。
我々は,最適なエージェントの1つに十分近い準最適専門家のパフォーマンスレベルが最適である場合に,最小限の最適化を行う一様サンプリングアルゴリズムを解析する。
論文 参考訳(メタデータ) (2024-01-08T12:39:25Z) - Hierarchical Decomposition of Prompt-Based Continual Learning:
Rethinking Obscured Sub-optimality [55.88910947643436]
大量のラベルのないデータを実際に扱うためには、自己教師付き事前トレーニングが不可欠である。
HiDe-Promptは、タスク固有のプロンプトと統計のアンサンブルで階層的なコンポーネントを明示的に最適化する革新的なアプローチである。
実験では,HiDe-Promptの優れた性能と,継続学習における事前学習パラダイムへの頑健さを実証した。
論文 参考訳(メタデータ) (2023-10-11T06:51:46Z) - No-Regret Online Prediction with Strategic Experts [16.54912614895861]
オンラインバイナリ予測の一般化をエキスパートアドバイスフレームワークを用いて研究し、各ラウンドで、学習者は、Kドルの専門家のプールからmgeq 1ドルの専門家を選ぶことができる。
我々は、専門家が戦略的に行動し、彼らの信念を誤報することでアルゴリズムの予測への影響を最大化することを目的とした設定に焦点を当てる。
目標は,次の2つの要件を満たすアルゴリズムを設計することです。 1) $textitIncentive-compatible$: 専門家に信念を真実に報告させるインセンティブ,2) $textitNo-regret$: Achieve。
論文 参考訳(メタデータ) (2023-05-24T16:43:21Z) - Recovering Top-Two Answers and Confusion Probability in Multi-Choice
Crowdsourcing [10.508187462682308]
我々は,クラウドソーシングの課題を,基礎的真理だけでなく,最も紛らわしい回答と混乱確率の回復を目標として検討している。
本稿では,各タスクの上位2つの答えが,他の選択肢と区別されるモデルを提案する。
このモデルでは、上位2つの答えと混乱確率の両方を推測する2段階の推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-29T09:46:39Z) - Optimal Tracking in Prediction with Expert Advice [0.0]
専門家のアドバイス設定を用いて予測を検証し、専門家の集合が生み出す決定を組み合わせて意思決定を行うことを目的とする。
我々は、専門家のアドバイス設定による予測の下で、最小限の動的後悔を達成する。
我々のアルゴリズムは、このような普遍的に最適で適応的で真にオンラインの保証を、事前の知識なしで生成した最初のアルゴリズムです。
論文 参考訳(メタデータ) (2022-08-07T12:29:54Z) - Mixture-of-Experts with Expert Choice Routing [44.777850078713634]
以前の作業では、トップk関数を使用して各トークンに一定数の専門家を割り当てていた。
本稿では,専門家選択手法を用いた異種混合実験を提案する。
本手法は, トレーニング収束時間を2倍以上改善する。
論文 参考訳(メタデータ) (2022-02-18T17:46:11Z) - Online Apprenticeship Learning [58.45089581278177]
見習い学習(AL)では、コスト関数にアクセスせずにマルコフ決定プロセス(MDP)が与えられます。
目標は、事前に定義されたコスト関数のセットで専門家のパフォーマンスに一致するポリシーを見つけることです。
ミラー下降型ノンレグレットアルゴリズムを2つ組み合わせることで,OAL問題を効果的に解くことができることを示す。
論文 参考訳(メタデータ) (2021-02-13T12:57:51Z) - Generalization in portfolio-based algorithm selection [97.74604695303285]
ポートフォリオベースのアルゴリズム選択に関する最初の証明可能な保証を提供する。
ポートフォリオが大きければ、非常に単純なアルゴリズムセレクタであっても、過剰適合は避けられないことを示す。
論文 参考訳(メタデータ) (2020-12-24T16:33:17Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。