論文の概要: Reinforcement Learning Agent Design and Optimization with Bandwidth
Allocation Model
- arxiv url: http://arxiv.org/abs/2211.12987v1
- Date: Wed, 23 Nov 2022 14:48:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 14:38:04.016274
- Title: Reinforcement Learning Agent Design and Optimization with Bandwidth
Allocation Model
- Title(参考訳): 帯域割当モデルを用いた強化学習エージェントの設計と最適化
- Authors: Rafael F. Reale, Joberto S. B. Martins
- Abstract要約: 強化学習 (Reinforcement Learning, RL) は現在、様々な実生活アプリケーションで使われている。
本稿では,BAMモデルがRLエージェントの設計と効率にどのように貢献するかを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reinforcement learning (RL) is currently used in various real-life
applications. RL-based solutions have the potential to generically address
problems, including the ones that are difficult to solve with heuristics and
meta-heuristics and, in addition, the set of problems and issues where some
intelligent or cognitive approach is required. However, reinforcement learning
agents require a not straightforward design and have important design issues.
RL agent design issues include the target problem modeling, state-space
explosion, the training process, and agent efficiency. Research currently
addresses these issues aiming to foster RL dissemination. A BAM model, in
summary, allocates and shares resources with users. There are three basic BAM
models and several hybrids that differ in how they allocate and share resources
among users. This paper addresses the issue of an RL agent design and
efficiency. The RL agent's objective is to allocate and share resources among
users. The paper investigates how a BAM model can contribute to the RL agent
design and efficiency. The AllocTC-Sharing (ATCS) model is analytically
described and simulated to evaluate how it mimics the RL agent operation and
how the ATCS can offload computational tasks from the RL agent. The essential
argument researched is whether algorithms integrated with the RL agent design
and operation have the potential to facilitate agent design and optimize its
execution. The ATCS analytical model and simulation presented demonstrate that
a BAM model offloads agent tasks and assists the agent's design and
optimization.
- Abstract(参考訳): 強化学習(rl)は現在、様々な現実のアプリケーションで使われている。
rlベースのソリューションは、ヒューリスティックやメタヒューリスティックで解決するのが難しい問題や、知的あるいは認知的なアプローチが必要な問題や問題など、問題を汎用的に解決する可能性を持っている。
しかし、強化学習エージェントは単純ではない設計が必要であり、重要な設計上の問題がある。
rlエージェントの設計問題には、ターゲット問題モデリング、状態空間爆発、トレーニングプロセス、エージェント効率などが含まれる。
研究は現在、RLの普及を促進するためにこれらの課題に対処している。
要約すると、BAMモデルはリソースをユーザと割り当て、共有する。
3つの基本的なBAMモデルと、ユーザ間でリソースの割り当てと共有方法が異なるいくつかのハイブリッドがある。
本稿ではRLエージェントの設計と効率の問題に対処する。
RLエージェントの目的は、ユーザ間でリソースを割り当て、共有することである。
本稿では,BAMモデルがRLエージェントの設計と効率にどのように貢献するかを検討する。
AllocTC-Sharing(ATCS)モデルは解析的に記述され、RLエージェントの動作をどのように模倣するか、そしてATCSがRLエージェントから計算タスクをオフロードするかを評価する。
RLエージェントの設計と操作を統合したアルゴリズムがエージェント設計を容易にし、その実行を最適化する可能性を秘めている。
ATCS分析モデルとシミュレーションは、BAMモデルがエージェントタスクをオフロードし、エージェントの設計と最適化を支援することを示した。
関連論文リスト
- A Neuromorphic Architecture for Reinforcement Learning from Real-Valued
Observations [0.34410212782758043]
強化学習(RL)は複雑な環境における意思決定のための強力なフレームワークを提供する。
本稿では,実測値を用いてRL問題を解くための新しいスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-06T12:33:34Z) - Mastering the Unsupervised Reinforcement Learning Benchmark from Pixels [112.63440666617494]
強化学習アルゴリズムは成功するが、エージェントと環境の間の大量の相互作用を必要とする。
本稿では,教師なしモデルベースRLを用いてエージェントを事前学習する手法を提案する。
我々はReal-Word RLベンチマークにおいて、適応中の環境摂動に対する抵抗性を示唆し、堅牢な性能を示す。
論文 参考訳(メタデータ) (2022-09-24T14:22:29Z) - INFOrmation Prioritization through EmPOWERment in Visual Model-Based RL [90.06845886194235]
モデルベース強化学習(RL)のための修正目的を提案する。
相互情報に基づく状態空間モデルに,変分エンパワーメントにインスパイアされた用語を統合する。
本研究は,視覚に基づくロボット制御作業における自然な映像背景を用いたアプローチの評価である。
論文 参考訳(メタデータ) (2022-04-18T23:09:23Z) - Modeling Bounded Rationality in Multi-Agent Simulations Using Rationally
Inattentive Reinforcement Learning [85.86440477005523]
我々は、人間不合理性の確立されたモデルであるRational Inattention(RI)モデルを含む、より人間的なRLエージェントについて検討する。
RIRLは、相互情報を用いた認知情報処理のコストをモデル化する。
我々は、RIRLを用いることで、合理的な仮定の下で発見されたものと異なる、新しい平衡挙動の豊富なスペクトルが得られることを示す。
論文 参考訳(メタデータ) (2022-01-18T20:54:00Z) - Automated Reinforcement Learning: An Overview [6.654552816487819]
強化学習と深層強化学習は、シーケンシャルな意思決定問題を解決する一般的な方法である。
本稿では,RLの自動化に使用可能な文献と最近の研究について考察する。
論文 参考訳(メタデータ) (2022-01-13T14:28:06Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - Combining Pessimism with Optimism for Robust and Efficient Model-Based
Deep Reinforcement Learning [56.17667147101263]
実世界のタスクでは、強化学習エージェントはトレーニング中に存在しない状況に遭遇する。
信頼性を確保するため、RLエージェントは最悪の状況に対して堅牢性を示す必要がある。
本稿では,Robust Hallucinated Upper-Confidence RL (RH-UCRL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-18T16:50:17Z) - Combining Reinforcement Learning with Model Predictive Control for
On-Ramp Merging [10.480121529429631]
自律運転における運動計画問題の解法として,モデル予測制御(MPC)と強化学習(RL)の2つの幅広い手法が提案されている。
まず、シミュレーションにより最先端のMPCとRLベースの技術の長所と短所を確立する。
その後、モデルフリーなRLエージェントとMPCソリューションをブレンドして、乗客の快適性、効率性、衝突速度、堅牢性といったすべての指標間のトレードオフを改善できることを示すアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-17T07:42:11Z) - OR-Gym: A Reinforcement Learning Library for Operations Research
Problems [0.0]
我々は,運用研究問題に対処する強化学習アルゴリズムを開発するためのオープンソースライブラリOR-Gymを紹介する。
本稿では,knapsackの強化学習,多次元ビンパッキング,複数エケロン供給チェーン,多周期アセットアロケーションモデル問題に適用する。
論文 参考訳(メタデータ) (2020-08-14T12:21:22Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。