論文の概要: Foundations of Reinforcement Learning and Interactive Decision Making
- arxiv url: http://arxiv.org/abs/2312.16730v1
- Date: Wed, 27 Dec 2023 21:58:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 18:18:32.117032
- Title: Foundations of Reinforcement Learning and Interactive Decision Making
- Title(参考訳): 強化学習と対話的意思決定の基礎
- Authors: Dylan J. Foster and Alexander Rakhlin
- Abstract要約: 本稿では,頻度主義的アプローチとベイズ的アプローチを用いた探索・探索ジレンマに対処するための統一的な枠組みを提案する。
ニューラルネットワークのような近似とフレキシブルなモデルクラスを機能させるために特別な注意が払われる。
- 参考スコア(独自算出の注目度): 81.76863968810423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: These lecture notes give a statistical perspective on the foundations of
reinforcement learning and interactive decision making. We present a unifying
framework for addressing the exploration-exploitation dilemma using frequentist
and Bayesian approaches, with connections and parallels between supervised
learning/estimation and decision making as an overarching theme. Special
attention is paid to function approximation and flexible model classes such as
neural networks. Topics covered include multi-armed and contextual bandits,
structured bandits, and reinforcement learning with high-dimensional feedback.
- Abstract(参考訳): これらの講義ノートは強化学習と対話的意思決定の基礎に関する統計的視点を与える。
本稿では,頻度主義的アプローチとベイズ的アプローチを用いて探索・探索ジレンマに対処するための統一的な枠組みを提案する。
ニューラルネットワークのような関数近似やフレキシブルモデルクラスには特に注意が払われている。
対象とするトピックには、マルチアームおよびコンテキストバンディット、構造化バンディット、高次元フィードバックによる強化学習などがある。
関連論文リスト
- Probing the Decision Boundaries of In-context Learning in Large Language Models [31.977886254197138]
本稿では,テキスト内二項分類のための決定境界のレンズからテキスト内学習を探索し,理解するための新しいメカニズムを提案する。
驚いたことに、単純な二項分類タスクにおいて、現在のLLMによって学習される決定境界は、しばしば不規則で非滑らかである。
論文 参考訳(メタデータ) (2024-06-17T06:00:24Z) - Knowledge-Enhanced Hierarchical Information Correlation Learning for
Multi-Modal Rumor Detection [82.94413676131545]
マルチモーダルなうわさ検出のための知識強化型階層型情報相関学習手法(KhiCL)を提案する。
KhiCLは異質な一様性特徴を共通特徴空間に伝達するために、クロスモーダルな関節辞書を利用する。
画像やテキストから視覚的およびテキスト的実体を抽出し、知識関連推論戦略を設計する。
論文 参考訳(メタデータ) (2023-06-28T06:08:20Z) - Bayesian Learning for Neural Networks: an algorithmic survey [95.42181254494287]
この自己完結型調査は、ベイズ学習ニューラルネットワークの原理とアルゴリズムを読者に紹介する。
アクセシブルで実践的な視点からこのトピックを紹介します。
論文 参考訳(メタデータ) (2022-11-21T21:36:58Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - It Takes Two Flints to Make a Fire: Multitask Learning of Neural
Relation and Explanation Classifiers [40.666590079580544]
一般化と説明可能性の間の緊張を緩和する関係抽出のための説明可能なアプローチを提案する。
提案手法では,関係抽出のための分類器を共同で訓練するマルチタスク学習アーキテクチャを用いる。
このアプローチにグローバルな説明をもたらすために、モデル出力をルールに変換する。
論文 参考訳(メタデータ) (2022-04-25T03:53:12Z) - Standardized feature extraction from pairwise conflicts applied to the
train rescheduling problem [0.0]
本研究では,2つの列車間の衝突を同定し,最適に解決する解析手法を提案する。
これらの矛盾を考慮に入れた最も関連性の高い情報を特徴付ける観測空間を設計する。
この方法で得られたデータは、強化学習フレームワークのコンテキストにおけるアクションに変換される。
論文 参考訳(メタデータ) (2022-04-06T19:52:43Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z) - Knowledge-guided Deep Reinforcement Learning for Interactive
Recommendation [49.32287384774351]
インタラクティブレコメンデーションは、アイテムとユーザ間の動的インタラクションから学び、応答性と精度を達成することを目的としている。
本稿では,知識指導型深層強化学習を提案する。
論文 参考訳(メタデータ) (2020-04-17T05:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。