論文の概要: Information Acquisition Under Resource Limitations in a Noisy
Environment
- arxiv url: http://arxiv.org/abs/2005.10383v1
- Date: Wed, 20 May 2020 22:49:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 05:41:52.995983
- Title: Information Acquisition Under Resource Limitations in a Noisy
Environment
- Title(参考訳): 騒音環境における資源制限下における情報獲得
- Authors: Matvey Soloviev, Joseph Y. Halpern
- Abstract要約: 雑音環境において,資源制限下での情報取得に関する理論的モデルを導入する。
エージェントは、与えられたブール式$varphi$の真理値を、式中の変数の真理値の有界な数の雑音テストを実行した後、推測しなければならない。
- 参考スコア(独自算出の注目度): 14.962745191428066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a theoretical model of information acquisition under resource
limitations in a noisy environment. An agent must guess the truth value of a
given Boolean formula $\varphi$ after performing a bounded number of noisy
tests of the truth values of variables in the formula. We observe that, in
general, the problem of finding an optimal testing strategy for $\phi$ is hard,
but we suggest a useful heuristic. The techniques we use also give insight into
two apparently unrelated, but well-studied problems: (1) \emph{rational
inattention}, that is, when it is rational to ignore pertinent information (the
optimal strategy may involve hardly ever testing variables that are clearly
relevant to $\phi$), and (2) what makes a formula hard to learn/remember.
- Abstract(参考訳): 雑音環境における資源制限下での情報獲得の理論モデルを提案する。
エージェントは、与えられたブール式$\varphi$の真理値を、論理式中の変数の真理値の有界なテストの後に推測しなければならない。
一般に、$\phi$の最適テスト戦略を見つけるという問題は難しいが、有用ヒューリスティックであることが示唆されている。
つまり、関連する情報を無視することが合理的である場合(最適戦略は$$\phi$と明確に関係のある変数をテストすることはほとんどないかもしれない)、(2)公式を学習/記憶しにくくする問題である。
関連論文リスト
- Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs [63.47351876442425]
本研究は,完全情報フィードバックの下で,相変わらずの相変わらずの線形混合MDPについて検討した。
本稿では,占領率に基づく手法と政策に基づく手法の利点を組み合わせた新しいアルゴリズムを提案する。
我々のアルゴリズムは$widetildemathcalO(d sqrtH3 K + sqrtHK(H + barP_K$)$ dynamic regret, ここで$d$は特徴次元である。
論文 参考訳(メタデータ) (2024-11-05T13:55:52Z) - Controlling Federated Learning for Covertness [15.878313629774269]
学習者は、ノイズの多い勾配評価を提供する分散オラクルを何度もクエリすることで、関数の$f$を最小化することを目指している。
同時に、学習者は、学習者のクエリを監視する悪意のある盗聴者から$argmin f$を隠そうとする。
本稿では,学習者が学習と難読化のどちらを動的に選択するかという,textitcovert や textitlearner-private 最適化の問題について考察する。
論文 参考訳(メタデータ) (2023-08-17T07:16:41Z) - Horizon-free Reinforcement Learning in Adversarial Linear Mixture MDPs [72.40181882916089]
我々のアルゴリズムが $tildeObig((d+log (|mathcalS|2 |mathcalA|))sqrtKbig)$ regret with full-information feedback, where $d$ is the dimension of a known feature mapping is linearly parametrizing the unknown transition kernel of the MDP, $K$ is the number of episodes, $|mathcalS|$ and $|mathcalA|$ is the standardities of the state and action space。
論文 参考訳(メタデータ) (2023-05-15T05:37:32Z) - Efficient Approximate Recovery from Pooled Data Using Doubly Regular
Pooling Schemes [1.7403133838762448]
隠れたビットをグリーディーな方法で推定する近似再構成アルゴリズムを解析する。
我々の分析はノイズの度合いと$sigma$の空間性に一様である。
論文 参考訳(メタデータ) (2023-02-28T19:31:40Z) - Tractable Optimality in Episodic Latent MABs [75.17357040707347]
我々は、エージェントが時間ステップ$H$のエピソードのために環境と対話する、M$遅延コンテキストを持つマルチアームバンディット問題を考える。
エピソードの長さによっては、学習者は遅れた文脈を正確に見積もることができないかもしれない。
我々は、$O(textttpoly(A) + textttpoly(M,H)min(M,H))$インタラクションを用いて、ほぼ最適なポリシーを確実に学習する手順を設計する。
論文 参考訳(メタデータ) (2022-10-05T22:53:46Z) - A Few Expert Queries Suffices for Sample-Efficient RL with Resets and
Linear Value Approximation [16.29514743112387]
最適値関数のみを線形化可能な設定において、サンプル効率のよい強化学習(RL)について検討する。
専門的なクエリと探索をブレンドするための統計的・計算学的に効率的なアルゴリズム(Delphi)を提案する。
Delphi には $tildemathcalO(d)$ エキスパートクエリと $texttpoly(d,|mathcalA|,1/varepsilon)$ 探索サンプルの量が必要です。
論文 参考訳(メタデータ) (2022-07-18T01:39:13Z) - An Experimental Design Perspective on Model-Based Reinforcement Learning [73.37942845983417]
環境からの状態遷移を観察するのは費用がかかる。
標準RLアルゴリズムは通常、学習するために多くの観測を必要とする。
本稿では,マルコフ決定過程について,状態-作用対がどの程度の情報を提供するかを定量化する獲得関数を提案する。
論文 参考訳(メタデータ) (2021-12-09T23:13:57Z) - ReLU Regression with Massart Noise [52.10842036932169]
本稿では、ReLU回帰の基本的問題として、Rectified Linear Units(ReLU)をデータに適合させることを目標としている。
我々は自然およびよく研究された半ランダムノイズモデルであるMassartノイズモデルにおけるReLU回帰に着目した。
このモデルにおいて,パラメータの正確な回復を実現する効率的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-09-10T02:13:22Z) - Tensor Estimation with Nearly Linear Samples Given Weak Side Information [5.69361786082969]
弱側情報はサンプルを$O(n)$に減らすのに十分であることを示す。
我々は、この側情報を利用して、任意の小さな定数$kappa > 0$に対して$O(n1+kappa)$サンプルを持つ一貫した推定子を生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-07-01T20:28:22Z) - Learning Near Optimal Policies with Low Inherent Bellman Error [115.16037976819331]
エピソード強化学習における近似線形作用値関数を用いた探索問題について検討する。
我々は,検討した設定に対して最適な統計率を達成するアルゴリズムを用いて,Emphbatch仮定のみを用いて探索を行うことが可能であることを示す。
論文 参考訳(メタデータ) (2020-02-29T02:02:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。