Fugu-MT 論文翻訳(概要): Deep Reinforcement Learning for Solving Management Problems: Towards A Large Management Mode

論文の概要: Deep Reinforcement Learning for Solving Management Problems: Towards A Large Management Mode

arxiv url: http://arxiv.org/abs/2403.00318v1
Date: Fri, 1 Mar 2024 06:40:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-05 18:08:26.463493
Title: Deep Reinforcement Learning for Solving Management Problems: Towards A Large Management Mode
Title（参考訳）: 管理問題を解決するための深層強化学習--大規模管理に向けて
Authors: Jinyang Jiang, Xiaotian Liu, Tao Ren, Qinghao Wang, Yi Zheng, Yufu Du, Yijie Peng and Cheng Zhang
Abstract要約: 本稿では,在庫管理や動的価格設定,レコメンデーションといった管理問題を解決するために,深層強化学習(DRL)アプローチを導入する。このDRLアプローチは、特定のトランスフォーマーニューラルネットワーク構造に基づく大規模な管理モデルにつながる可能性がある。
参考スコア（独自算出の注目度）: 12.205830919471673
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce a deep reinforcement learning (DRL) approach for solving management problems including inventory management, dynamic pricing, and recommendation. This DRL approach has the potential to lead to a large management model based on certain transformer neural network structures, resulting in an artificial general intelligence paradigm for various management tasks. Traditional methods have limitations for solving complex real-world problems, and we demonstrate how DRL can surpass existing heuristic approaches for solving management tasks. We aim to solve the problems in a unified framework, considering the interconnections between different tasks. Central to our methodology is the development of a foundational decision model coordinating decisions across the different domains through generative decision-making. Our experimental results affirm the effectiveness of our DRL-based framework in complex and dynamic business environments. This work opens new pathways for the application of DRL in management problems, highlighting its potential to revolutionize traditional business management.
Abstract（参考訳）: 本稿では,在庫管理や動的価格設定,レコメンデーションといった管理問題を解決するために,深層強化学習(DRL)アプローチを導入する。このDRLアプローチは、特定のトランスフォーマーニューラルネットワーク構造に基づく大規模な管理モデルにつながる可能性があり、様々な管理タスクのための汎用的なパラダイムをもたらす。従来の手法は複雑な現実世界の問題を解決するのに限界があり、DRLが既存のヒューリスティックな手法を超越して管理タスクを解く方法を示す。我々は,異なるタスク間の相互接続を考慮した統一的なフレームワークで問題を解決することを目的とする。我々の方法論の中心は、生成的意思決定を通じて異なる領域にわたる意思決定を協調する基盤的決定モデルの開発である。複雑・動的ビジネス環境におけるDRLベースのフレームワークの有効性を実験的に検証した。この作業は、従来のビジネスマネジメントに革命をもたらす可能性を強調し、DRLをマネジメント問題に適用するための新たな経路を開く。

関連論文リスト

AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning [129.44038804430542]
本稿では,マルチターン対話型意思決定のためのLLMエージェントをRLで学習する新しいフレームワークであるAgentGym-RLを紹介する。本研究では,探索-探索バランスと安定したRL最適化のためのトレーニング手法であるScalingInter-RLを提案する。当社のエージェントは、さまざまな環境にまたがる27のタスクで、商用モデルにマッチするか、超えています。
論文参考訳（メタデータ） (2025-09-10T16:46:11Z)
VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning [69.44871115752055]
本稿では,PCuRL(Progressive Curriculum Reinforcement Learning)フレームワークを用いて学習した高度なマルチモーダル推論モデルを提案する。 PCuRLは、難易度が徐々に増大するタスクを通じてモデルを体系的にガイドし、多様なマルチモーダルコンテキストにおける推論能力を大幅に向上させる。本フレームワークは,(1)連続するRLトレーニング段階におけるトレーニング難度を動的に調整するオンライン難易度重み付け機構,(2)タスク複雑度に応じて推論経路長を適応的に調整する動的長報奨機構,の2つの重要なイノベーションを紹介する。
論文参考訳（メタデータ） (2025-07-30T12:23:21Z)
Deep RL Dual Sourcing Inventory Management with Supply and Capacity Risk Awareness [4.583289433858458]
介入モデルを利用して大規模最適化問題に強化学習(RL)を効率的に適用する方法を検討する。我々は,サプライチェーン最適化におけるマルチソース多周期在庫管理問題である,現実世界の挑戦的アプリケーションに対するアプローチを実証する。
論文参考訳（メタデータ） (2025-07-19T02:44:45Z)
BEAVER: Building Environments with Assessable Variation for Evaluating Multi-Objective Reinforcement Learning [4.342241136871849]
制御タスク構築において、一般化可能な強化学習アルゴリズムの評価を容易にするための新しいベンチマークを開発する。この結果から,既存の多目的RL法は相反する目的間の合理的なトレードオフを達成できることが示唆された。
論文参考訳（メタデータ） (2025-07-10T13:54:38Z)
A Survey of Reinforcement Learning-Based Motion Planning for Autonomous Driving: Lessons Learned from a Driving Task Perspective [12.239468388345747]
自律運転(AD)における運動計画(MoP)課題に対処するための有望なアプローチとして強化学習(RL)が登場した。 RLとADの急速な進歩にもかかわらず、RLの設計プロセスの体系的な記述と解釈はまだ未開発である。この調査は、タスク固有の視点から学ぶことに焦点を当てた、RLベースのMoP for ADの包括的なレビューを提供する。
論文参考訳（メタデータ） (2025-03-31T01:31:14Z)
Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.4890331763196]
大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。 LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文参考訳（メタデータ） (2025-03-20T22:37:15Z)
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [79.2162092822111]
我々は,一連のナビゲーションタスクにおいて,強化学習(RL)と制御に基づく手法を体系的に評価する。我々は、JEPA(Joint Embedding Predictive Architecture)を使用して、潜在ダイナミクスモデルを使用し、それを計画に使用します。その結果,モデルベースプランニングではレイアウトが不明瞭になるのに対して,モデルフリーのRLは高品質なデータから恩恵を受けることがわかった。
論文参考訳（メタデータ） (2025-02-20T18:39:41Z)
Towards Sample-Efficiency and Generalization of Transfer and Inverse Reinforcement Learning: A Comprehensive Literature Review [50.67937325077047]
本稿では,転送および逆強化学習(T-IRL)によるRLアルゴリズムのサンプル効率と一般化を実現するための総合的なレビューを行う。以上の結果から,最近の研究成果の大部分は,人間のループとシム・トゥ・リアル戦略を活用することで,上記の課題に対処していることが示唆された。 IRL構造の下では、経験の少ない移行と、そのようなフレームワークのマルチエージェントおよびマルチインテンション問題への拡張を必要とするトレーニングスキームが近年研究者の優先事項となっている。
論文参考訳（メタデータ） (2024-11-15T15:18:57Z)
Reinforcement Learning for Dynamic Memory Allocation [0.0]
本稿では,RLエージェントがシステムとのインタラクションから連続的に学習し,メモリ管理の戦術を改善する枠組みを提案する。その結果、RLは従来のアロケーション戦略にマッチし、超えるエージェントを訓練できることがわかった。また,アロケータの複雑な要求パターン処理能力を高めるために,従来のアロケーション要求を利用した履歴対応ポリシの可能性についても検討する。
論文参考訳（メタデータ） (2024-10-20T20:13:46Z)
A Deep Q-Network Based on Radial Basis Functions for Multi-Echelon Inventory Management [6.149034764951798]
本稿では,複雑なネットワークトポロジによる複数エケロン在庫管理問題に対処する。 Q-ネットワークが放射基底関数に基づくDRLモデルを開発する。ベースストックポリシーが最適であるシリアルシステムにおいて、マルチエケロンシステムにおけるより良いポリシーと競争性能を生成する。
論文参考訳（メタデータ） (2024-01-29T04:11:56Z)
Solving the flexible job-shop scheduling problem through an enhanced deep reinforcement learning approach [1.565361244756411]
本稿では、特に大規模インスタンスにおいて、フレキシブルなジョブショップスケジューリング問題を解決するための新しいDRL法を提案する。このアプローチは、問題をより情報的なグラフ表現にヘテロジニアスグラフニューラルネットワークを使用することに基づいている。
論文参考訳（メタデータ） (2023-10-24T10:35:08Z)
On Realization of Intelligent Decision-Making in the Real World: A Foundation Decision Model Perspective [54.38373782121503]
FDM(Foundation Decision Model)は、様々な意思決定タスクをシーケンスデコーディングタスクとして定式化することで開発することができる。本稿では、FDMの実装であるDigitalBrain(DB1)を13億のパラメータで実証し、870のタスクで人間レベルのパフォーマンスを達成するケーススタディを提案する。
論文参考訳（メタデータ） (2022-12-24T06:16:45Z)
Product Segmentation Newsvendor Problems: A Robust Learning Approach [6.346881818701668]
商品セグメンテーションニューズベンダー問題は、ニューズベンダー問題の新たな変種である。本稿では、ロバストな政策の魅力を高めるために、ロバストな学習という新しいパラダイムを提案する。
論文参考訳（メタデータ） (2022-07-08T10:13:10Z)
State-Augmented Learnable Algorithms for Resource Management in Wireless Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文参考訳（メタデータ） (2022-07-05T18:02:54Z)
Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文参考訳（メタデータ） (2021-11-23T18:24:47Z)
Knowledge Transfer in Multi-Task Deep Reinforcement Learning for Continuous Control [65.00425082663146]
連続制御のための知識伝達に基づく多タスク深層強化学習フレームワーク(KTM-DRL)を提案する。 KTM-DRLでは、マルチタスクエージェントがまずオフラインの知識伝達アルゴリズムを利用して、タスク固有の教師の経験から制御ポリシーを素早く学習する。実験結果は,KTM-DRLとその知識伝達とオンライン学習アルゴリズムの有効性を正当化するとともに,最先端技術よりも大きなマージンによる優位性を示した。
論文参考訳（メタデータ） (2020-10-15T03:26:47Z)
Dynamics Generalization via Information Bottleneck in Deep Reinforcement Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文参考訳（メタデータ） (2020-08-03T02:24:20Z)
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms [10.09712608508383]
モデルベースとモデルフリー制御を組み合わせた計算モデルは,前頭前野のRLと呼ばれ,人間が学習した高レベル政策に関する情報を確実にエンコードする。これは、脳が一般的な問題を解決する方法を模倣する計算モデルが実用的な解決策をもたらす可能性を正式にテストする最初の試みである。
論文参考訳（メタデータ） (2020-07-09T06:32:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。