論文の概要: Optimal Scoring Rule Design
- arxiv url: http://arxiv.org/abs/2107.07420v1
- Date: Thu, 15 Jul 2021 16:05:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-16 17:46:51.578539
- Title: Optimal Scoring Rule Design
- Title(参考訳): 最適採点ルール設計
- Authors: Yiling Chen and Fang-Yi Yu
- Abstract要約: 適切なスコアリングルールのための2つの最適化条件(静的とセッティング)について検討する。
静的な設定では,分布の集合が有限であるとき,最適スコアリングルールを計算するための効率的なアルゴリズムを提案する。
エージェントの後方分布がBeta-Bernoulli過程である場合、ログスコアリングルールが最適であることを示す。
- 参考スコア(独自算出の注目度): 18.4654743456555
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces an optimization problem for proper scoring rule design.
Consider a principal who wants to collect an agent's prediction about an
unknown state. The agent can either report his prior prediction or access a
costly signal and report the posterior prediction. Given a collection of
possible distributions containing the agent's posterior prediction
distribution, the principal's objective is to design a bounded scoring rule to
maximize the agent's worst-case payoff increment between reporting his
posterior prediction and reporting his prior prediction.
We study two settings of such optimization for proper scoring rules: static
and asymptotic settings. In the static setting, where the agent can access one
signal, we propose an efficient algorithm to compute an optimal scoring rule
when the collection of distributions is finite. The agent can adaptively and
indefinitely refine his prediction in the asymptotic setting. We first consider
a sequence of collections of posterior distributions with vanishing covariance,
which emulates general estimators with large samples, and show the optimality
of the quadratic scoring rule. Then, when the agent's posterior distribution is
a Beta-Bernoulli process, we find that the log scoring rule is optimal. We also
prove the optimality of the log scoring rule over a smaller set of functions
for categorical distributions with Dirichlet priors.
- Abstract(参考訳): 本稿では,適切なスコアリングルール設計のための最適化問題を提案する。
未知の状態に関するエージェントの予測を収集したいプリンシパルを考えてみましょう。
エージェントは、自分の事前予測を報告するか、コストのかかる信号にアクセスし、後続予測を報告できる。
エージェントの後方予測分布を含む可能性のある分布の集合が与えられた場合、プリンシパルの目的は、エージェントの後方予測の報告と事前予測の報告の間に、エージェントの最悪のケースの支払い増分を最大化するために、境界付きスコアリングルールを設計することである。
適切なスコアリングルールのための2つの最適化条件(静的および漸近的設定)について検討する。
エージェントが1つの信号にアクセス可能な静的設定において,分布の収集が有限である場合に最適なスコアリングルールを計算する効率的なアルゴリズムを提案する。
エージェントは漸近的な設定で彼の予測を適応的かつ無期限に洗練することができる。
まず, 2次スコアリング則の最適性を示すため, 一般推定器を大きなサンプルでエミュレートする, 共分散が消滅した後続分布の集合について考察する。
そして, エージェントの後方分布がβ-ベルヌーリ過程である場合, ログスコアリングルールが最適であることが判明した。
また,dirichlet prior を持つカテゴリ分布に対する,より小さな関数集合に対するログスコアリング規則の最適性も証明する。
関連論文リスト
- Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.09480867526656]
人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文 参考訳(メタデータ) (2024-05-26T05:38:50Z) - Are Bounded Contracts Learnable and Approximately Optimal? [8.121834515103243]
本稿では,主エージェントが契約を用いてプロジェクトに取り組む動機付けを行う,主エージェント問題の隠れアクションモデルについて考察する。
本研究では,有界決済契約が学習可能か,ほぼ最適かを検討する。
論文 参考訳(メタデータ) (2024-02-22T12:19:19Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Bi-discriminator Domain Adversarial Neural Networks with Class-Level
Gradient Alignment [87.8301166955305]
そこで本研究では,クラスレベルのアライメントアライメントを有するバイディミネータドメイン対向ニューラルネットワークを提案する。
BACGは、領域分布の整合性を改善するために勾配信号と二階確率推定を利用する。
さらに、対照的な学習にインスパイアされ、トレーニングプロセスを大幅に短縮できるメモリバンクベースの変種であるFast-BACGを開発した。
論文 参考訳(メタデータ) (2023-10-21T09:53:17Z) - FIRE: An Optimization Approach for Fast Interpretable Rule Extraction [7.538482310185135]
本稿では,ツリーアンサンブルから少数の決定ルールを抽出する最適化ベースのフレームワークであるFIRE(Fast Interpretable Rule extract)を提案する。
我々の実験では、FIREはスパースルールセットを構築する際に最先端のアンサンブルアルゴリズムより優れており、既存の手法よりも解釈可能なモデルを提供できることを示した。
論文 参考訳(メタデータ) (2023-06-12T21:27:39Z) - Learning to Incentivize Information Acquisition: Proper Scoring Rules
Meet Principal-Agent Model [64.94131130042275]
インセンティブ付き情報取得問題について検討し、主治官がエージェントを雇って代理情報を収集する。
UCBアルゴリズムをモデルに適合させる,実証可能なサンプル効率の良いアルゴリズムを設計する。
本アルゴリズムは,主役の最適利益に対する微妙な推定手順と,所望のエージェントの行動にインセンティブを与える保守的な補正手法を特徴とする。
論文 参考訳(メタデータ) (2023-03-15T13:40:16Z) - Computing the optimal distributionally-robust strategy to commit to [32.1464237233989]
分布的に不安定なスタックルバーグ均衡は、常に幅広い不確実性モデルにわたって存在することを示す。
そこで我々は,分散ロバストな強いスタックルバーグ均衡を計算するための2つのアルゴリズムを提案する。
実験は,従来のStackelbergゲーム上でのアルゴリズムのトラクタビリティを裏付けるものである。
論文 参考訳(メタデータ) (2022-09-15T23:20:26Z) - Better Short than Greedy: Interpretable Models through Optimal Rule
Boosting [10.938624307941197]
ルールアンサンブルは、予測精度とモデル解釈可能性の間の有用なトレードオフを提供するように設計されている。
与えられたアンサンブルサイズに対して最大予測力の規則アンサンブルを適合させる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T01:03:48Z) - A Distributional Analysis of Sampling-Based Reinforcement Learning
Algorithms [67.67377846416106]
定常ステップサイズに対する強化学習アルゴリズムの理論解析に対する分布的アプローチを提案する。
本稿では,TD($lambda$)や$Q$-Learningのような値ベースの手法が,関数の分布空間で制約のある更新ルールを持つことを示す。
論文 参考訳(メタデータ) (2020-03-27T05:13:29Z) - Optimal Change-Point Detection with Training Sequences in the Large and
Moderate Deviations Regimes [72.68201611113673]
本稿では,情報理論の観点から,新しいオフライン変化点検出問題について検討する。
基礎となる事前および変更後分布の知識は分かっておらず、利用可能なトレーニングシーケンスからのみ学習できると仮定する。
論文 参考訳(メタデータ) (2020-03-13T23:39:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。