論文の概要: Situational-Constrained Sequential Resources Allocation via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2506.14125v1
- Date: Tue, 17 Jun 2025 02:40:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.299287
- Title: Situational-Constrained Sequential Resources Allocation via Reinforcement Learning
- Title(参考訳): 強化学習による状況制約付きシーケンスリソースの配置
- Authors: Libo Zhang, Yang Chen, Toru Takisaka, Kaiqi Zhao, Weidong Li, Jiamou Liu,
- Abstract要約: 状況制約を伴う逐次資源配分は、現実世界のアプリケーションにおいて大きな課題となる。
本稿では,この問題に対処するための新しいフレームワークであるSCRLを紹介する。
我々は制約違反を動的に罰する新しいアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 17.8234166913582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential Resource Allocation with situational constraints presents a significant challenge in real-world applications, where resource demands and priorities are context-dependent. This paper introduces a novel framework, SCRL, to address this problem. We formalize situational constraints as logic implications and develop a new algorithm that dynamically penalizes constraint violations. To handle situational constraints effectively, we propose a probabilistic selection mechanism to overcome limitations of traditional constraint reinforcement learning (CRL) approaches. We evaluate SCRL across two scenarios: medical resource allocation during a pandemic and pesticide distribution in agriculture. Experiments demonstrate that SCRL outperforms existing baselines in satisfying constraints while maintaining high resource efficiency, showcasing its potential for real-world, context-sensitive decision-making tasks.
- Abstract(参考訳): 状況制約を伴うシーケンシャルなリソース割り当ては、リソースの要求と優先順位がコンテキストに依存している現実世界のアプリケーションにおいて重要な課題となる。
本稿では,この問題に対処するための新しいフレームワークであるSCRLを紹介する。
我々は状況制約を論理的含意として定式化し、制約違反を動的に罰する新しいアルゴリズムを開発する。
本研究では,従来の制約強化学習(CRL)アプローチの制約を克服する確率的選択機構を提案する。
SCRLは、パンデミック時の医療資源配分と農業における殺虫剤分布の2つのシナリオにまたがって評価される。
実験により、SCRLは制約を満たす上で既存のベースラインを上回り、高いリソース効率を維持し、実世界のコンテキストに敏感な意思決定タスクの可能性を示している。
関連論文リスト
- Probabilistic Satisfaction of Temporal Logic Constraints in Reinforcement Learning via Adaptive Policy-Switching [0.0]
Constrained Reinforcement Learning (CRL)は、従来の強化学習(RL)フレームワークに制約を導入する機械学習のサブセットである。
純粋学習(逆)と制約満足度を切り替えることに依存する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-10-10T15:19:45Z) - Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.00997996453842]
本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。
HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2024-06-25T07:42:30Z) - Resilient Constrained Reinforcement Learning [87.4374430686956]
本稿では,複数の制約仕様を事前に特定しない制約付き強化学習(RL)のクラスについて検討する。
報酬訓練目標と制約満足度との間に不明確なトレードオフがあるため、適切な制約仕様を特定することは困難である。
我々は、ポリシーと制約仕様を一緒に検索する新しい制約付きRLアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:28:23Z) - Reinforcement Learning with Stepwise Fairness Constraints [50.538878453547966]
本稿では,段階的公正性制約を伴う強化学習について紹介する。
我々は、ポリシーの最適性と公正性違反に関して、強力な理論的保証を持つ学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-11-08T04:06:23Z) - Neural-Progressive Hedging: Enforcing Constraints in Reinforcement
Learning with Stochastic Programming [8.942831966541231]
本稿では、強化学習(RL)ポリシーを実行するオンラインフェーズにおいて、プログラミングを活用するフレームワークを提案する。
目的は、条件付きバリュー・アット・リスク(CVaR)のような制約やリスクベースの目標に対する実現性を確保することである。
NPフレームワークは、深いRLや他のベースラインアプローチよりも優れたポリシーを生成することを示す。
論文 参考訳(メタデータ) (2022-02-27T19:39:19Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Constrained Reinforcement Learning for Dynamic Optimization under
Uncertainty [1.5797349391370117]
動的リアルタイム最適化(DRTO)は、最適動作条件をリアルタイムに計算する必要があるという事実から難しい課題である。
DRTOの産業応用における主要なボトルネックは、不確実性の存在である。
これらの課題に対応するために,制約付き強化学習(RL)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-04T10:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。