論文の概要: Sequential Naive Learning
- arxiv url: http://arxiv.org/abs/2101.02897v1
- Date: Fri, 8 Jan 2021 08:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 08:34:30.006619
- Title: Sequential Naive Learning
- Title(参考訳): シークエンシャルナイーブ学習
- Authors: Itai Arieli, Yakov Babichenko, Manuel Mueller-Frank
- Abstract要約: 連立動作と連立状態を持つモデルにおける集合統計量から有理的に有理な更新を解析する。
エージェントはそれぞれ、前のアクションの順序のないセットを観察した後、不可逆的なアクションをシーケンスで取ります。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We analyze boundedly rational updating from aggregate statistics in a model
with binary actions and binary states. Agents each take an irreversible action
in sequence after observing the unordered set of previous actions. Each agent
first forms her prior based on the aggregate statistic, then incorporates her
signal with the prior based on Bayes rule, and finally applies a decision rule
that assigns a (mixed) action to each belief. If priors are formed according to
a discretized DeGroot rule, then actions converge to the state (in
probability), i.e., \emph{asymptotic learning}, in any informative information
structure if and only if the decision rule satisfies probability matching. This
result generalizes to unspecified information settings where information
structures differ across agents and agents know only the information structure
generating their own signal. Also, the main result extends to the case of $n$
states and $n$ actions.
- Abstract(参考訳): 連立動作と連立状態を持つモデルにおける集合統計量から有理的に有理な更新を解析する。
エージェントはそれぞれ、順序づけられていない前のアクションのセットを観察した後、シーケンスで不可逆アクションを取る。
各エージェントは、まずアグリゲートの統計に基づいて先行し、次に彼女の信号をベイズ規則に基づく先行と結合し、最終的に(混合)アクションを各信念に割り当てる決定規則を適用する。
事前が離散化されたDeGroot則に従って形成される場合、決定規則が確率マッチングを満たす場合に限り、任意の情報構造において状態(確率における)に作用が収束する。
この結果は、エージェント間で情報構造が異なる不特定情報設定に一般化され、エージェントは自身の信号を生成する情報構造のみを知る。
また、主な結果は$n$ stateと$n$ actionの場合に拡張される。
関連論文リスト
- Pre-training and Diagnosing Knowledge Base Completion Models [58.07183284468881]
我々は,事実の集合から他の集合への知識伝達へのアプローチを,エンティティや関係マッチングを必要とせずに導入し,分析する。
主な貢献は、構造化されていないテキストから収集された事実の大規模事前学習を利用する方法である。
得られた事前学習モデルをよりよく理解するために,オープン知識ベースコンプリートのための事前学習モデルの解析のための新しいデータセットを導入する。
論文 参考訳(メタデータ) (2024-01-27T15:20:43Z) - A Robbins--Monro Sequence That Can Exploit Prior Information For Faster
Convergence [10.172984565625294]
先行情報であるRobins-Monro列は、幅広い先行分布に対して収束していることを示す。
我々は、その性能とパラメータの影響を理解するために、そのシーケンスを数値解析する。
論文 参考訳(メタデータ) (2024-01-06T12:42:58Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Sequential Principal-Agent Problems with Communication: Efficient
Computation and Learning [27.50523143132825]
両端に不完全な情報を持つ主要因とエージェント間の逐次的意思決定問題について検討する。
このモデルでは、プリンシパルとエージェントは環境の中で相互作用し、それぞれが他で利用できない状態についての観測にプライベートである。
本稿では,アルゴリズムのアルゴリズムを用いて,主成分の最適ポリシを加法近似まで計算する。
論文 参考訳(メタデータ) (2023-06-06T16:20:44Z) - Toward Intention Discovery for Early Malice Detection in Bitcoin [7.627156550422715]
理想的な検出モデルは, (I) 早期検出, (II) 良好な解釈性, (III) 様々な不正行為に対する汎用性の3つの特性をすべて達成できることが期待される。
アドレスの初期特性を記述した資産移動経路を提案する。
階層的自己注意予測器は、所定のアドレスのラベルをリアルタイムで予測する。
論文 参考訳(メタデータ) (2022-09-24T13:04:22Z) - Relational Action Bases: Formalization, Effective Safety Verification,
and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。
RABは両方の制限を解除することで既存のモデルを一般化する。
データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-08-12T17:03:50Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - Bandit Linear Optimization for Sequential Decision Making and
Extensive-Form Games [102.23975166536326]
tree-form sequential decision making (tfsdm) は、エージェントと潜在的に敵対的な環境の間のツリー形式の相互作用をモデル化することで、古典的なワンショット意思決定を拡張する。
これは、各プレイヤーが幅広い形式のゲームで直面するオンライン意思決定問題、およびマルコフ決定プロセス、およびエージェントが観測された履歴を条件とする部分観察可能なマルコフ決定プロセスをキャプチャする。
本稿では, (i) 線形時間損失と (ii) $o(sqrtt)$ cumulative regret の両方を提供する拡張dmのバンディット線形最適化問題に対する最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T05:00:13Z) - Causal Bandits without prior knowledge using separating sets [3.1000291317725]
カウサル・バンディット(Causal Bandit)は、エージェントがシーケンシャルな意思決定プロセスにおいて最良のアクションを識別しなければならない古典的なバンディット問題の変種である。
これまでの文献で提案されている手法は、完全な因果グラフの正確な事前知識に依存している。
我々は、必ずしも因果知識に依存しない新たな因果バンディットアルゴリズムを定式化する。
論文 参考訳(メタデータ) (2020-09-16T20:08:03Z) - Tractable Inference in Credal Sentential Decision Diagrams [116.6516175350871]
確率感性決定図は、解離ゲートの入力が確率値によってアノテートされる論理回路である。
我々は、局所確率を質量関数のクレーダル集合に置き換えることができる確率の一般化である、クレーダル感性決定図を開発する。
まず,ノイズの多い7セグメント表示画像に基づく簡単なアプリケーションについて検討する。
論文 参考訳(メタデータ) (2020-08-19T16:04:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。