論文の概要: Distributed Stackelberg Strategies in State-based Potential Games for Autonomous Decentralized Learning Manufacturing Systems
- arxiv url: http://arxiv.org/abs/2408.06397v1
- Date: Mon, 12 Aug 2024 08:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-14 19:38:59.958727
- Title: Distributed Stackelberg Strategies in State-based Potential Games for Autonomous Decentralized Learning Manufacturing Systems
- Title(参考訳): 分散スタックルバーグ戦略 : 自律型分散学習生産システムのための状態ベースの可能性ゲーム
- Authors: Steve Yuwono, Dorothea Schwung, Andreas Schwung,
- Abstract要約: 本稿では,多目的最適化課題を伴う分散型製造システムを自律的に最適化するゲーム構造について述べる。
DS2-SbPGは、潜在的なゲームとStackelbergゲームを統合することで、潜在的なゲームの協調的なトレードオフ能力と、Stackelbergゲームによる多目的最適化処理を改善する。
- 参考スコア(独自算出の注目度): 3.447848701446987
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This article describes a novel game structure for autonomously optimizing decentralized manufacturing systems with multi-objective optimization challenges, namely Distributed Stackelberg Strategies in State-Based Potential Games (DS2-SbPG). DS2-SbPG integrates potential games and Stackelberg games, which improves the cooperative trade-off capabilities of potential games and the multi-objective optimization handling by Stackelberg games. Notably, all training procedures remain conducted in a fully distributed manner. DS2-SbPG offers a promising solution to finding optimal trade-offs between objectives by eliminating the complexities of setting up combined objective optimization functions for individual players in self-learning domains, particularly in real-world industrial settings with diverse and numerous objectives between the sub-systems. We further prove that DS2-SbPG constitutes a dynamic potential game that results in corresponding converge guarantees. Experimental validation conducted on a laboratory-scale testbed highlights the efficacy of DS2-SbPG and its two variants, such as DS2-SbPG for single-leader-follower and Stack DS2-SbPG for multi-leader-follower. The results show significant reductions in power consumption and improvements in overall performance, which signals the potential of DS2-SbPG in real-world applications.
- Abstract(参考訳): 本稿では,多目的最適化課題(DS2-SbPGにおける分散Stackelberg Strategies in State-Based Potential Games (DS2-SbPG))を用いて,分散化された製造システムを自律的に最適化するゲーム構造について述べる。
DS2-SbPGは、潜在的なゲームとStackelbergゲームを統合することで、潜在的なゲームの協調的なトレードオフ能力と、Stackelbergゲームによる多目的最適化処理を改善する。
特に、すべてのトレーニング手順は、完全に分散した方法で実行されます。
DS2-SbPGは、自律学習領域における個々のプレイヤー、特にサブシステム間の多様かつ多様な目的を持つ実世界の産業環境において、統合された目的最適化関数を設定する複雑さを排除し、目的間の最適なトレードオフを見つけるための有望なソリューションを提供する。
さらに、DS2-SbPGは、対応する収束保証をもたらす動的ポテンシャルゲームを構成することを証明した。
DS2-SbPGとDS2-SbPG, Stack DS2-SbPG, Stack DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG, DS2-SbPG,
その結果,実世界のアプリケーションにおけるDS2-SbPGの可能性を示す電力消費の大幅な削減と全体的な性能の向上が示された。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Self-optimization in distributed manufacturing systems using Modular State-based Stackelberg Games [3.156133122658661]
モジュール製造システムにおける分散自己学習のための新しいゲーム構造である,Modular State-based Stackelberg Games (Mod-SbSG)を紹介する。
Mod-SbSGは、SbPG(State-based potential Games)とStackelbergゲームを統合することで、プロダクションシステム内の自己学習エージェント間の協調的な意思決定を強化する。
論文 参考訳(メタデータ) (2024-10-30T11:09:31Z) - Diversity-Rewarded CFG Distillation [62.08448835625036]
そこで本研究では,CFGの限界に対処しつつ,CFGの強度を蒸留する新しい微調整法であるCFG蒸留を導入する。
提案手法は,(1)蒸留目標,(CFGを使わずに)モデルのみにCFG拡張予測を模倣するよう促すこと,(2)多様性報酬を付与したRL目標,および与えられたプロンプトに対する多様な出力の生成を促進すること,の2つの訓練目標を最適化する。
論文 参考訳(メタデータ) (2024-10-08T14:40:51Z) - Gradient-based Learning in State-based Potential Games for Self-Learning Production Systems [3.156133122658661]
本稿では,自己学習型分散生産システムにおける状態ベースポテンシャルゲーム(SbPG)の勾配に基づく最適化手法を提案する。
SbPGは自己最適化型分散マルチエージェントシステムの実現に有効であることが認識されている。
論文 参考訳(メタデータ) (2024-06-14T13:26:36Z) - Opportunistic Qualitative Planning in Stochastic Systems with Incomplete
Preferences over Reachability Objectives [24.11353445650682]
優先順位は、すべての制約が同時に満たされない場合に、どの目標/制約を満たすかを決定する上で重要な役割を果たします。
本稿では,SPIおよびSASI戦略を合成し,複数の逐次改善を実現するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-04T19:53:08Z) - Toward multi-target self-organizing pursuit in a partially observable
Markov game [34.22625222101752]
本研究では,探索・追従における暗黙的協調機能を改善するために,分散化されたマルチエージェントシステムのためのフレームワークを提案する。
我々は,大規模な分散化,部分的な観察,非コミュニケーションを特徴とする,部分的に観測可能なマルコフゲーム(POMG)として自己組織化システムをモデル化する。
提案した分散アルゴリズムは, ファジィ自己組織化協調共進化(FSC2)を利用して, マルチターゲットSOPにおける3つの課題を解決する。
論文 参考訳(メタデータ) (2022-06-24T14:59:56Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z) - LiDAR-based Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
LiDARベースのパノプティカルセグメンテーションは、オブジェクトとシーンを統一的に解析することを目的としている。
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,現在の最先端手法よりも優れた精度を実現する。
論文 参考訳(メタデータ) (2020-11-24T08:44:46Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Distributed Reinforcement Learning for Cooperative Multi-Robot Object
Manipulation [53.262360083572005]
強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討
分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。
本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
論文 参考訳(メタデータ) (2020-03-21T00:43:54Z) - Partially Observable Games for Secure Autonomy [24.23487459915111]
2人のプレイヤーによる部分的に観察可能なゲームフォーマリズムは、不確実性の下でのハイレベルな自律ミッション計画と、不完全な情報に基づく敵の意思決定の両方を捉えることを提案した。
自律型意思決定とサイバーアドバイザリーの両方の有限メモリ仮定の下で,このようなゲームに対する準最適戦略の合成が可能であることを示す。
論文 参考訳(メタデータ) (2020-02-05T19:31:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。