論文の概要: Distributed Task Management in Fog Computing: A Socially Concave Bandit
Game
- arxiv url: http://arxiv.org/abs/2203.14572v2
- Date: Fri, 9 Jun 2023 15:15:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 18:33:04.954112
- Title: Distributed Task Management in Fog Computing: A Socially Concave Bandit
Game
- Title(参考訳): フォグコンピューティングにおける分散タスク管理: 社会的にコンケーブなバンディットゲーム
- Authors: Xiaotong Cheng and Setareh Maghsudi
- Abstract要約: Fogコンピューティングは、ネットワークエッジでのタスクオフロード機能を活用して、効率を改善し、アプリケーション要求に対する迅速な応答を可能にする。
分散タスク割り当て問題を,帯域幅フィードバックによるソーシャルコンケーブゲームとして定式化する。
我々は2つのオンライン意思決定戦略を策定する。
- 参考スコア(独自算出の注目度): 7.708904950194129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fog computing leverages the task offloading capabilities at the network's
edge to improve efficiency and enable swift responses to application demands.
However, the design of task allocation strategies in a fog computing network is
still challenging because of the heterogeneity of fog nodes and uncertainties
in system dynamics. We formulate the distributed task allocation problem as a
social-concave game with bandit feedback and show that the game has a unique
Nash equilibrium, which is implementable using no-regret learning strategies
(regret with sublinear growth). We then develop two no-regret online
decision-making strategies. One strategy, namely bandit gradient ascent with
momentum, is an online convex optimization algorithm with bandit feedback. The
other strategy, Lipschitz bandit with initialization, is an EXP3 multi-armed
bandit algorithm. We establish regret bounds for both strategies and analyze
their convergence characteristics. Moreover, we compare the proposed strategies
with an allocation strategy named learning with linear rewards. Theoretical-
and numerical analysis shows the superior performance of the proposed
strategies for efficient task allocation compared to the state-of-the-art
methods.
- Abstract(参考訳): フォグコンピューティングはネットワークエッジのタスクオフロード機能を活用し、効率を改善し、アプリケーション要求に対する迅速な応答を可能にする。
しかし,フォグノードの不均一性やシステムダイナミクスの不確実性のため,フォグコンピューティングネットワークにおけるタスク割り当て戦略の設計は依然として難しい。
分散タスク割当問題を,バンディットフィードバックを伴うソーシャル・コンケーブゲームとして定式化し,非回帰学習戦略(サブリニア成長に応答する)を用いて実装可能なナッシュ均衡が存在することを示す。
次に,オンライン意思決定戦略を2つ開発する。
一つの戦略、すなわちbandit gradient ascent with momentumは、banditフィードバックを伴うオンライン凸最適化アルゴリズムである。
もう1つの戦略は、初期化を伴うリプシッツ・バンディットであり、EXP3多重武装バンディットアルゴリズムである。
両戦略に対する後悔の限界を確立し,その収束特性を解析する。
さらに,提案手法を線形報酬を用いた学習というアロケーション戦略と比較した。
理論的および数値解析により,提案手法は最先端手法と比較して効率的なタスク割当を行うための優れた性能を示す。
関連論文リスト
- Paths to Equilibrium in Games [6.812247730094933]
我々は、強化学習におけるポリシー更新に触発されたペアワイズ制約を満たす戦略の列について研究する。
我々の分析は、戦略的な更新を劣化させる報酬が、満足のいく道に沿って均衡に進むための鍵である、という直感的な洞察を明らかにした。
論文 参考訳(メタデータ) (2024-03-26T19:58:39Z) - Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - Towards Optimal Randomized Strategies in Adversarial Example Game [13.287949447721115]
敵対的なサンプル攻撃に対するディープニューラルネットワークモデルの脆弱性は、多くの人工知能アプリケーションにおいて実践的な課題である。
確率分布空間上の新しい無限次元連続時間フローを用いて問題をモデル化するFRATと呼ばれるアルゴリズムを提案する。
我々は、FRATの連続時間制限がディフェンダーとアタッカーによって形成されたゼロサムゲームにおいて混合ナッシュ平衡に収束することを証明する。
論文 参考訳(メタデータ) (2023-06-29T07:29:23Z) - Sampling-based Reactive Synthesis for Nondeterministic Hybrid Systems [20.0212772540119]
本稿では,非決定論的ハイブリッドシステムのためのサンプリング型戦略合成アルゴリズムを提案する。
我々は,ハイブリッドシステムの進化を,非決定主義が敵対的プレイヤーである2人プレイヤゲームとしてモデル化する。
目的は、敵プレイヤーのあらゆる可能な動きの下でゴールの満足度を保証する、勝利戦略 - 反応性(ロバスト)戦略を合成することである。
論文 参考訳(メタデータ) (2023-04-14T00:45:16Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Mixed Strategies for Security Games with General Defending Requirements [37.02840909260615]
Stackelbergのセキュリティゲームはディフェンダーとアタッカーの間で行われ、ディフェンダーは複数のターゲットに限られたリソースを割り当てる必要がある。
そこで本研究では,ごく少数の戦略のみを用いる混合戦略を計算し,効率的な近似パチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-26T08:56:39Z) - Projective Ranking-based GNN Evasion Attacks [52.85890533994233]
グラフニューラルネットワーク(GNN)は、グラフ関連のタスクに対して、有望な学習方法を提供する。
GNNは敵の攻撃の危険にさらされている。
論文 参考訳(メタデータ) (2022-02-25T21:52:09Z) - Learning Generative Deception Strategies in Combinatorial Masking Games [27.2744631811653]
詐欺の1つの方法は、システムがどのように構成されているかに関する情報を隠蔽したり、マスキングしたりすることである。
本稿では,攻撃者側がマスクする属性のサブセットを選択するのに対して,攻撃者は攻撃を行うエクスプロイトを選択することで応答する,結果として生じるディフェンダー・アタックラー相互作用のゲーム理論モデルを提案する。
両プレイヤーの戦略をニューラルネットワークとして表現することにより,そのようなゲームを概ね解くための,新しい高度にスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-23T20:42:44Z) - Online Adversarial Attacks [57.448101834579624]
我々は、実世界のユースケースで見られる2つの重要な要素を強調し、オンライン敵攻撃問題を定式化する。
まず、オンライン脅威モデルの決定論的変種を厳格に分析する。
このアルゴリズムは、現在の最良の単一しきい値アルゴリズムよりも、$k=2$の競争率を確実に向上させる。
論文 参考訳(メタデータ) (2021-03-02T20:36:04Z) - Online Markov Decision Processes with Aggregate Bandit Feedback [74.85532145498742]
本稿では,オンライン有限水平マルコフ決定過程の新たな変種について検討する。
各エピソードにおいて、学習者は、エピソードの選択した方針によって実現された軌道に沿って蓄積された損失を被り、総括的盗聴フィードバックを観察する。
我々の主な結果は計算効率のよいアルゴリズムで、$O(sqrtK)$ regret for this set, where $K$ is the number of episodes。
論文 参考訳(メタデータ) (2021-01-31T16:49:07Z) - Beyond UCB: Optimal and Efficient Contextual Bandits with Regression
Oracles [112.89548995091182]
我々は、文脈的帯域幅からオンライン回帰への、初めての普遍的で最適な削減を提供する。
我々のアルゴリズムは、実現可能性以上の分布仮定は必要とせず、コンテキストが逆選択された場合でも機能する。
論文 参考訳(メタデータ) (2020-02-12T11:33:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。