論文の概要: Sequential Naive Learning
- arxiv url: http://arxiv.org/abs/2101.02897v1
- Date: Fri, 8 Jan 2021 08:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 08:34:30.006619
- Title: Sequential Naive Learning
- Title(参考訳): シークエンシャルナイーブ学習
- Authors: Itai Arieli, Yakov Babichenko, Manuel Mueller-Frank
- Abstract要約: 連立動作と連立状態を持つモデルにおける集合統計量から有理的に有理な更新を解析する。
エージェントはそれぞれ、前のアクションの順序のないセットを観察した後、不可逆的なアクションをシーケンスで取ります。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We analyze boundedly rational updating from aggregate statistics in a model
with binary actions and binary states. Agents each take an irreversible action
in sequence after observing the unordered set of previous actions. Each agent
first forms her prior based on the aggregate statistic, then incorporates her
signal with the prior based on Bayes rule, and finally applies a decision rule
that assigns a (mixed) action to each belief. If priors are formed according to
a discretized DeGroot rule, then actions converge to the state (in
probability), i.e., \emph{asymptotic learning}, in any informative information
structure if and only if the decision rule satisfies probability matching. This
result generalizes to unspecified information settings where information
structures differ across agents and agents know only the information structure
generating their own signal. Also, the main result extends to the case of $n$
states and $n$ actions.
- Abstract(参考訳): 連立動作と連立状態を持つモデルにおける集合統計量から有理的に有理な更新を解析する。
エージェントはそれぞれ、順序づけられていない前のアクションのセットを観察した後、シーケンスで不可逆アクションを取る。
各エージェントは、まずアグリゲートの統計に基づいて先行し、次に彼女の信号をベイズ規則に基づく先行と結合し、最終的に(混合)アクションを各信念に割り当てる決定規則を適用する。
事前が離散化されたDeGroot則に従って形成される場合、決定規則が確率マッチングを満たす場合に限り、任意の情報構造において状態(確率における)に作用が収束する。
この結果は、エージェント間で情報構造が異なる不特定情報設定に一般化され、エージェントは自身の信号を生成する情報構造のみを知る。
また、主な結果は$n$ stateと$n$ actionの場合に拡張される。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Pre-training and Diagnosing Knowledge Base Completion Models [58.07183284468881]
我々は,事実の集合から他の集合への知識伝達へのアプローチを,エンティティや関係マッチングを必要とせずに導入し,分析する。
主な貢献は、構造化されていないテキストから収集された事実の大規模事前学習を利用する方法である。
得られた事前学習モデルをよりよく理解するために,オープン知識ベースコンプリートのための事前学習モデルの解析のための新しいデータセットを導入する。
論文 参考訳(メタデータ) (2024-01-27T15:20:43Z) - A Robbins--Monro Sequence That Can Exploit Prior Information For Faster
Convergence [10.172984565625294]
先行情報であるRobins-Monro列は、幅広い先行分布に対して収束していることを示す。
我々は、その性能とパラメータの影響を理解するために、そのシーケンスを数値解析する。
論文 参考訳(メタデータ) (2024-01-06T12:42:58Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Learning and Predicting Multimodal Vehicle Action Distributions in a
Unified Probabilistic Model Without Labels [26.303522885475406]
本稿では、個別の車両行動の代表集合を学習し、特定のシナリオに応じて各行動の確率を予測する統一確率モデルを提案する。
我々のモデルはまた、シナリオ上で条件付けられた連続的な軌道上の分布を推定することができ、そのシナリオで実行された場合、それぞれの離散アクションがどのように見えるかを表現します。
論文 参考訳(メタデータ) (2022-12-14T04:01:19Z) - Toward Intention Discovery for Early Malice Detection in Bitcoin [7.627156550422715]
理想的な検出モデルは, (I) 早期検出, (II) 良好な解釈性, (III) 様々な不正行為に対する汎用性の3つの特性をすべて達成できることが期待される。
アドレスの初期特性を記述した資産移動経路を提案する。
階層的自己注意予測器は、所定のアドレスのラベルをリアルタイムで予測する。
論文 参考訳(メタデータ) (2022-09-24T13:04:22Z) - Relational Action Bases: Formalization, Effective Safety Verification,
and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。
RABは両方の制限を解除することで既存のモデルを一般化する。
データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-08-12T17:03:50Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - Causal Bandits without prior knowledge using separating sets [3.1000291317725]
カウサル・バンディット(Causal Bandit)は、エージェントがシーケンシャルな意思決定プロセスにおいて最良のアクションを識別しなければならない古典的なバンディット問題の変種である。
これまでの文献で提案されている手法は、完全な因果グラフの正確な事前知識に依存している。
我々は、必ずしも因果知識に依存しない新たな因果バンディットアルゴリズムを定式化する。
論文 参考訳(メタデータ) (2020-09-16T20:08:03Z) - Tractable Inference in Credal Sentential Decision Diagrams [116.6516175350871]
確率感性決定図は、解離ゲートの入力が確率値によってアノテートされる論理回路である。
我々は、局所確率を質量関数のクレーダル集合に置き換えることができる確率の一般化である、クレーダル感性決定図を開発する。
まず,ノイズの多い7セグメント表示画像に基づく簡単なアプリケーションについて検討する。
論文 参考訳(メタデータ) (2020-08-19T16:04:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。