論文の概要: Serial Parallel Reliability Redundancy Allocation Optimization for Energy Efficient and Fault Tolerant Cloud Computing
- arxiv url: http://arxiv.org/abs/2404.03665v1
- Date: Fri, 16 Feb 2024 16:46:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 12:08:31.206013
- Title: Serial Parallel Reliability Redundancy Allocation Optimization for Energy Efficient and Fault Tolerant Cloud Computing
- Title(参考訳): エネルギー効率・フォールトトレラントクラウドコンピューティングのためのシリアル並列信頼性冗長配置最適化
- Authors: Gutha Jaya Krishna,
- Abstract要約: Serial-parallelの冗長性は、クラウドコンピューティングでサービスとシステムが利用できることを保証する信頼性の高い方法である。
エラーが発生した場合、非アクティブコピーはすぐにバックアップとしてステップインできる。
このアプローチは並列冗長( parallel redundancy)と呼ばれ、それ以外はアクティブアクティブ冗長(active-active redundancy)と呼ばれる。
- 参考スコア(独自算出の注目度): 2.61072980439312
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Serial-parallel redundancy is a reliable way to ensure service and systems will be available in cloud computing. That method involves making copies of the same system or program, with only one remaining active. When an error occurs, the inactive copy can step in as a backup right away, this provides continuous performance and uninterrupted operation. This approach is called parallel redundancy, otherwise known as active-active redundancy, and its exceptional when it comes to strategy. It creates duplicates of a system or service that are all running at once. By doing this fault tolerance increases since if one copy fails, the workload can be distributed across any replica thats functioning properly. Reliability allocation depends on features in a system and the availability and fault tolerance you want from it. Serial redundancy or parallel redundancies can be applied to increase the dependability of systems and services. To demonstrate how well this concept works, we looked into fixed serial parallel reliability redundancy allocation issues followed by using an innovative hybrid optimization technique to find the best possible allocation for peak dependability. We then measured our findings against other research.
- Abstract(参考訳): Serial-parallelの冗長性は、クラウドコンピューティングでサービスとシステムが利用できることを保証する信頼性の高い方法である。
この方法は、同一のシステムまたはプログラムのコピーを作成することを含み、残る1つだけがアクティブである。
エラーが発生した場合、非アクティブコピーはすぐにバックアップとしてステップインでき、継続的なパフォーマンスと未中断の操作を提供する。
このアプローチは並列冗長( parallel redundancy)と呼ばれ、それ以外はアクティブな冗長(active-active redundancy)と呼ばれ、戦略に関しては例外的である。
すべて一度に実行されるシステムやサービスの複製を生成します。
このフォールトトレランスを実行することで、1つのコピーが失敗すると、適切に機能するすべてのレプリカにワークロードを分散させることができる。
信頼性の割り当ては、システムの機能と、必要な可用性とフォールトトレランスに依存します。
システムやサービスの信頼性を高めるために、シリアル冗長性や並列冗長性を適用することができる。
この概念がいかにうまく機能するかを実証するために、固定並列信頼性の冗長性割り当て問題について検討し、その後に革新的なハイブリッド最適化手法を用いてピーク依存度に最適なアロケーションを求める。
研究の結果を他の研究と比較した。
関連論文リスト
- Employing Software Diversity in Cloud Microservices to Engineer Reliable and Performant Systems [2.412158290827225]
本研究は,システムの信頼性と性能を同時に向上するために,ソフトウェアの多様性を活用することを提案する。
私たちの仕事の土台は信頼性基準の導出です。
目標は、より信頼性の高いバージョンに対して、可能な限り多くのバージョンを保存しながら、より高いレプリカ数を維持することである。
論文 参考訳(メタデータ) (2024-07-10T00:34:39Z) - Digital Twin-Assisted Data-Driven Optimization for Reliable Edge Caching in Wireless Networks [60.54852710216738]
我々はD-RECと呼ばれる新しいデジタルツインアシスト最適化フレームワークを導入し、次世代無線ネットワークにおける信頼性の高いキャッシュを実現する。
信頼性モジュールを制約付き決定プロセスに組み込むことで、D-RECは、有利な制約に従うために、アクション、報酬、状態を適応的に調整することができる。
論文 参考訳(メタデータ) (2024-06-29T02:40:28Z) - Training Through Failure: Effects of Data Consistency in Parallel Machine Learning Training [0.0]
本研究では,障害時の並列機械学習トレーニングにおけるデータ一貫性の緩和の影響について検討する。
私たちの障害復旧戦略には、従来のチェックポイント、チェーンレプリケーション、新しいステートレスパラメータサーバアプローチが含まれています。
論文 参考訳(メタデータ) (2024-06-08T18:31:56Z) - A Comprehensive Benchmarking Analysis of Fault Recovery in Stream Processing Frameworks [1.3398445165628463]
本稿では, クラウドネイティブ環境における障害復旧性能, 安定性, 回復時間に関する包括的解析を行う。
以上の結果から,Flinkは最も安定しており,最高の障害回復の1つであることが示唆された。
K Kafka Streamsは適切なフォールトリカバリパフォーマンスと安定性を示しているが、イベントレイテンシは高い。
論文 参考訳(メタデータ) (2024-04-09T10:49:23Z) - On the Role of Server Momentum in Federated Learning [85.54616432098706]
a)フェデレートラーニング(FL)において未探索な大量のモーメントスキームを網羅するサーバモーメントの一般的な枠組みを提案する。
提案するフレームワークに対して厳密な収束解析を行う。
論文 参考訳(メタデータ) (2023-12-19T23:56:49Z) - Iterative Sketching for Secure Coded Regression [66.53950020718021]
分散線形回帰を高速化する手法を提案する。
具体的には、方程式の系の基礎をランダムに回転させ、次にサブサンプルブロックを回転させ、情報を同時に確保し、回帰問題の次元を小さくする。
論文 参考訳(メタデータ) (2023-08-08T11:10:42Z) - Dual Generator Offline Reinforcement Learning [90.05278061564198]
オフラインのRLでは、学習したポリシーをデータに近づき続けることが不可欠である。
実際には、GANベースのオフラインRL法は代替手法と同様に実行されていない。
2つのジェネレータを持つことにより、有効なGANベースのオフラインRL法が実現されるだけでなく、サポート制約を近似することも示している。
論文 参考訳(メタデータ) (2022-11-02T20:25:18Z) - Learning Mean-Field Control for Delayed Information Load Balancing in
Large Queuing Systems [26.405495663998828]
本研究では,多くのクライアント(ロードバランサ)と多数の並列キューで構成される遅延情報を備えたマルチエージェントロードバランシングシステムについて考察する。
我々は、最適負荷分散ソリューションを見つけるためにポリシー勾配強化学習アルゴリズムを適用した。
我々のアプローチはスケーラブルだが、Join-the-Shortest-Queue (JSQ)の最先端のパワー・オブ・ド・バリアントと比較すると、優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-08-09T13:47:19Z) - Layer-Wise Partitioning and Merging for Efficient and Scalable Deep
Learning [16.38731019298993]
我々は、より優れたトレーニング性能を提供するために、新しいレイヤワイドパーティショニングとマージ、前方および後方パス並列フレームワークを提案している。
実使用事例を実験的に評価したところ,提案手法は訓練速度において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-07-22T11:47:34Z) - An Efficient Asynchronous Method for Integrating Evolutionary and
Gradient-based Policy Search [76.73477450555046]
本稿では、ESの並列効率を最大化し、ポリシー勾配法と統合する非同期進化戦略強化学習(AES-RL)を提案する。
具体的には、(1)ESとDRLを非同期にマージする新しいフレームワークを提案し、2)非同期、ES、DRLのすべての利点を利用できる様々な非同期更新方法を提案する。
論文 参考訳(メタデータ) (2020-12-10T02:30:48Z) - Accelerating Feedforward Computation via Parallel Nonlinear Equation
Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。
本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。
提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文 参考訳(メタデータ) (2020-02-10T10:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。