論文の概要: Active Sampling of Multiple Sources for Sequential Estimation
- arxiv url: http://arxiv.org/abs/2208.05406v1
- Date: Wed, 10 Aug 2022 15:58:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-11 13:28:46.604858
- Title: Active Sampling of Multiple Sources for Sequential Estimation
- Title(参考訳): 逐次推定のための複数音源のアクティブサンプリング
- Authors: Arpan Mukherjee, Ali Tajer, Pin-Yu Chen, Payel Das
- Abstract要約: 本研究の目的は,パラメータを逐次推定するアクティブサンプリングアルゴリズムを設計し,信頼性の高い推定値を生成することである。
本稿では, エンフ条件推定コスト関数を導入し, 最近, トラクタブル解析を施した逐次推定手法を提案する。
- 参考スコア(独自算出の注目度): 92.37271004438406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider $K$ processes, each generating a sequence of identical and
independent random variables. The probability measures of these processes have
random parameters that must be estimated. Specifically, they share a parameter
$\theta$ common to all probability measures. Additionally, each process
$i\in\{1, \dots, K\}$ has a private parameter $\alpha_i$. The objective is to
design an active sampling algorithm for sequentially estimating these
parameters in order to form reliable estimates for all shared and private
parameters with the fewest number of samples. This sampling algorithm has three
key components: (i)~data-driven sampling decisions, which dynamically over time
specifies which of the $K$ processes should be selected for sampling;
(ii)~stopping time for the process, which specifies when the accumulated data
is sufficient to form reliable estimates and terminate the sampling process;
and (iii)~estimators for all shared and private parameters. Owing to the
sequential estimation being known to be analytically intractable, this paper
adopts \emph {conditional} estimation cost functions, leading to a sequential
estimation approach that was recently shown to render tractable analysis.
Asymptotically optimal decision rules (sampling, stopping, and estimation) are
delineated, and numerical experiments are provided to compare the efficacy and
quality of the proposed procedure with those of the relevant approaches.
- Abstract(参考訳): k$ プロセスを考え、それぞれが同一かつ独立な確率変数の列を生成する。
これらの過程の確率測度は、推定しなければならないランダムパラメータを持つ。
具体的には、すべての確率測度に共通するパラメータ$\theta$を共有する。
さらに、各プロセス $i\in\{1, \dots, K\}$ はプライベートパラメータ $\alpha_i$ を持つ。
最少サンプル数の共有パラメータとプライベートパラメータの信頼性の高い推定を行うために,これらのパラメータを逐次推定するアクティブサンプリングアルゴリズムを設計することが目的である。
このサンプリングアルゴリズムには3つの重要な要素がある。
i)~データ駆動型サンプリング決定。時間とともに動的にK$プロセスのどれをサンプリングに選択すべきかを指定する。
(ii) 蓄積したデータが信頼できる見積もりを形成し、サンプリングプロセスを終了するのに十分な時期を特定するプロセスの停止時間。
(iii)~共有パラメーターおよびプライベートパラメーターの推定子。
逐次的推定が解析可能であることが知られているため,本論文では<emph { Conditional} 推定コスト関数を導入し,最近,抽出可能な解析を行うための逐次的推定手法を提案する。
漸近的に最適な決定規則(サンプリング,停止,推定)を定式化し,提案手法の有効性と品質を比較する数値実験を行った。
関連論文リスト
- Online Data Collection for Efficient Semiparametric Inference [41.49486724979923]
提案する2つのオンラインデータ収集ポリシーであるExplore-then-CommitとExplore-then-Greedyは、パラメータ推定を所定の時間で使用して、将来のステップで残りの予算を最適に割り当てる。
両政策がオラクル政策に対してゼロ後悔(MSEによる評価)を達成することを実証する。
論文 参考訳(メタデータ) (2024-11-05T15:40:53Z) - Efficient Learning of POMDPs with Known Observation Model in Average-Reward Setting [56.92178753201331]
我々は,POMDPパラメータを信念に基づくポリシを用いて収集したサンプルから学習することのできる観測・認識スペクトル(OAS)推定手法を提案する。
提案するOAS-UCRLアルゴリズムに対して,OASプロシージャの整合性を示し,$mathcalO(sqrtT log(T)$の残差保証を証明した。
論文 参考訳(メタデータ) (2024-10-02T08:46:34Z) - Non-Stochastic CDF Estimation Using Threshold Queries [3.6576781735746513]
実験的な分布を2つの課題で推定する問題に取り組む。
まず、アルゴリズムはデータを直接観察するのではなく、サンプルについて限られた数のしきい値クエリしか要求しない。
第二に、データは独立で同一の分散であると仮定されず、代わりにサンプルを生成する任意のプロセスが可能である。
論文 参考訳(メタデータ) (2023-01-13T18:00:57Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Machine Learning based optimization for interval uncertainty propagation
with application to vibro-acoustic models [0.0]
工学系の性能解析には2つの非侵入的不確実性伝播法が提案されている。
1つのアプローチは、応答変数の上と下の境界を別々に評価するために、2つの異なるトレーニングデータセットを反復的に構築する。
もう1つは反復的に単一のトレーニングデータセットを構築します。
論文 参考訳(メタデータ) (2021-06-21T15:57:11Z) - Adaptive Sequential Design for a Single Time-Series [2.578242050187029]
期待される結果を最適化するために、設計の制御されたコンポーネントの最適かつ未知の選択を学習する。
我々は、時間とともに収集されたデータに基づいて、将来のタイムポイント実験にランダム化機構を適用する。
論文 参考訳(メタデータ) (2021-01-29T22:51:45Z) - Noise-Contrastive Estimation for Multivariate Point Processes [28.23193933174945]
本稿では,低コストな目的のノイズコントラスト推定手法を提案する。
モデルが保持データ上で同じレベルのログ化を実現するためには,機能評価が大幅に少なく,壁面時間も少なくする必要がある。
論文 参考訳(メタデータ) (2020-11-02T04:09:33Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z) - Sampling from a $k$-DPP without looking at all items [58.30573872035083]
カーネル関数とサブセットサイズ$k$が与えられた場合、我々のゴールは、サブセットによって誘導されるカーネル行列の行列式に比例する確率を持つ$n$アイテムから$k$をサンプリングすることである(つまり$k$-DPP)。
既存の$k$-DPPサンプリングアルゴリズムは、すべての$n$アイテムを複数回パスする高価な前処理ステップを必要とするため、大規模なデータセットでは利用できない。
そこで我々は, 十分大きなデータの均一なサンプルを適応的に構築し, より小さな$k$のアイテムを効率よく生成するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-06-30T16:40:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。