論文の概要: Deep Reinforcement Learning for Solving Management Problems: Towards A
Large Management Mode
- arxiv url: http://arxiv.org/abs/2403.00318v1
- Date: Fri, 1 Mar 2024 06:40:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 18:08:26.463493
- Title: Deep Reinforcement Learning for Solving Management Problems: Towards A
Large Management Mode
- Title(参考訳): 管理問題を解決するための深層強化学習--大規模管理に向けて
- Authors: Jinyang Jiang, Xiaotian Liu, Tao Ren, Qinghao Wang, Yi Zheng, Yufu Du,
Yijie Peng and Cheng Zhang
- Abstract要約: 本稿では,在庫管理や動的価格設定,レコメンデーションといった管理問題を解決するために,深層強化学習(DRL)アプローチを導入する。
このDRLアプローチは、特定のトランスフォーマーニューラルネットワーク構造に基づく大規模な管理モデルにつながる可能性がある。
- 参考スコア(独自算出の注目度): 12.205830919471673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a deep reinforcement learning (DRL) approach for solving
management problems including inventory management, dynamic pricing, and
recommendation. This DRL approach has the potential to lead to a large
management model based on certain transformer neural network structures,
resulting in an artificial general intelligence paradigm for various management
tasks. Traditional methods have limitations for solving complex real-world
problems, and we demonstrate how DRL can surpass existing heuristic approaches
for solving management tasks. We aim to solve the problems in a unified
framework, considering the interconnections between different tasks. Central to
our methodology is the development of a foundational decision model
coordinating decisions across the different domains through generative
decision-making. Our experimental results affirm the effectiveness of our
DRL-based framework in complex and dynamic business environments. This work
opens new pathways for the application of DRL in management problems,
highlighting its potential to revolutionize traditional business management.
- Abstract(参考訳): 本稿では,在庫管理や動的価格設定,レコメンデーションといった管理問題を解決するために,深層強化学習(DRL)アプローチを導入する。
このDRLアプローチは、特定のトランスフォーマーニューラルネットワーク構造に基づく大規模な管理モデルにつながる可能性があり、様々な管理タスクのための汎用的なパラダイムをもたらす。
従来の手法は複雑な現実世界の問題を解決するのに限界があり、DRLが既存のヒューリスティックな手法を超越して管理タスクを解く方法を示す。
我々は,異なるタスク間の相互接続を考慮した統一的なフレームワークで問題を解決することを目的とする。
我々の方法論の中心は、生成的意思決定を通じて異なる領域にわたる意思決定を協調する基盤的決定モデルの開発である。
複雑・動的ビジネス環境におけるDRLベースのフレームワークの有効性を実験的に検証した。
この作業は、従来のビジネスマネジメントに革命をもたらす可能性を強調し、DRLをマネジメント問題に適用するための新たな経路を開く。
関連論文リスト
- A Deep Q-Network Based on Radial Basis Functions for Multi-Echelon
Inventory Management [6.149034764951798]
本稿では,複雑なネットワークトポロジによる複数エケロン在庫管理問題に対処する。
Q-ネットワークが放射基底関数に基づくDRLモデルを開発する。
ベースストックポリシーが最適であるシリアルシステムにおいて、マルチエケロンシステムにおけるより良いポリシーと競争性能を生成する。
論文 参考訳(メタデータ) (2024-01-29T04:11:56Z) - Solving the flexible job-shop scheduling problem through an enhanced
deep reinforcement learning approach [1.565361244756411]
本稿では、特に大規模インスタンスにおいて、フレキシブルなジョブショップスケジューリング問題を解決するための新しいDRL法を提案する。
このアプローチは、問題をより情報的なグラフ表現にヘテロジニアスグラフニューラルネットワークを使用することに基づいている。
論文 参考訳(メタデータ) (2023-10-24T10:35:08Z) - On Realization of Intelligent Decision-Making in the Real World: A
Foundation Decision Model Perspective [54.38373782121503]
FDM(Foundation Decision Model)は、様々な意思決定タスクをシーケンスデコーディングタスクとして定式化することで開発することができる。
本稿では、FDMの実装であるDigitalBrain(DB1)を13億のパラメータで実証し、870のタスクで人間レベルのパフォーマンスを達成するケーススタディを提案する。
論文 参考訳(メタデータ) (2022-12-24T06:16:45Z) - Product Segmentation Newsvendor Problems: A Robust Learning Approach [6.346881818701668]
商品セグメンテーションニューズベンダー問題は、ニューズベンダー問題の新たな変種である。
本稿では、ロバストな政策の魅力を高めるために、ロバストな学習という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-07-08T10:13:10Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Improved Context-Based Offline Meta-RL with Attention and Contrastive
Learning [1.3106063755117399]
SOTA OMRLアルゴリズムの1つであるFOCALを、タスク内注意メカニズムとタスク間コントラスト学習目標を組み込むことで改善します。
理論解析と実験を行い、エンドツーエンドおよびモデルフリーの優れた性能、効率、堅牢性を実証します。
論文 参考訳(メタデータ) (2021-02-22T05:05:16Z) - Knowledge Transfer in Multi-Task Deep Reinforcement Learning for
Continuous Control [65.00425082663146]
連続制御のための知識伝達に基づく多タスク深層強化学習フレームワーク(KTM-DRL)を提案する。
KTM-DRLでは、マルチタスクエージェントがまずオフラインの知識伝達アルゴリズムを利用して、タスク固有の教師の経験から制御ポリシーを素早く学習する。
実験結果は,KTM-DRLとその知識伝達とオンライン学習アルゴリズムの有効性を正当化するとともに,最先端技術よりも大きなマージンによる優位性を示した。
論文 参考訳(メタデータ) (2020-10-15T03:26:47Z) - Dynamics Generalization via Information Bottleneck in Deep Reinforcement
Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。
迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。
この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文 参考訳(メタデータ) (2020-08-03T02:24:20Z) - On the Reliability and Generalizability of Brain-inspired Reinforcement
Learning Algorithms [10.09712608508383]
モデルベースとモデルフリー制御を組み合わせた計算モデルは,前頭前野のRLと呼ばれ,人間が学習した高レベル政策に関する情報を確実にエンコードする。
これは、脳が一般的な問題を解決する方法を模倣する計算モデルが実用的な解決策をもたらす可能性を正式にテストする最初の試みである。
論文 参考訳(メタデータ) (2020-07-09T06:32:42Z) - Learning What to Defer for Maximum Independent Sets [84.00112106334655]
本稿では,各段階における解の要素的決定を学習することにより,エージェントが適応的に段階数を縮小あるいは拡張する,新たなDRL方式を提案する。
提案手法を最大独立集合(MIS)問題に適用し、現状のDRL方式よりも大幅に改善したことを示す。
論文 参考訳(メタデータ) (2020-06-17T02:19:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。