Fugu-MT 論文翻訳(概要): Serial Parallel Reliability Redundancy Allocation Optimization for Energy Efficient and Fault Tolerant Cloud Computing

論文の概要: Serial Parallel Reliability Redundancy Allocation Optimization for Energy Efficient and Fault Tolerant Cloud Computing

arxiv url: http://arxiv.org/abs/2404.03665v1
Date: Fri, 16 Feb 2024 16:46:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-01 12:08:31.206013
Title: Serial Parallel Reliability Redundancy Allocation Optimization for Energy Efficient and Fault Tolerant Cloud Computing
Title（参考訳）: エネルギー効率・フォールトトレラントクラウドコンピューティングのためのシリアル並列信頼性冗長配置最適化
Authors: Gutha Jaya Krishna,
Abstract要約: Serial-parallelの冗長性は、クラウドコンピューティングでサービスとシステムが利用できることを保証する信頼性の高い方法である。エラーが発生した場合、非アクティブコピーはすぐにバックアップとしてステップインできる。このアプローチは並列冗長( parallel redundancy)と呼ばれ、それ以外はアクティブアクティブ冗長(active-active redundancy)と呼ばれる。
参考スコア（独自算出の注目度）: 2.61072980439312
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Serial-parallel redundancy is a reliable way to ensure service and systems will be available in cloud computing. That method involves making copies of the same system or program, with only one remaining active. When an error occurs, the inactive copy can step in as a backup right away, this provides continuous performance and uninterrupted operation. This approach is called parallel redundancy, otherwise known as active-active redundancy, and its exceptional when it comes to strategy. It creates duplicates of a system or service that are all running at once. By doing this fault tolerance increases since if one copy fails, the workload can be distributed across any replica thats functioning properly. Reliability allocation depends on features in a system and the availability and fault tolerance you want from it. Serial redundancy or parallel redundancies can be applied to increase the dependability of systems and services. To demonstrate how well this concept works, we looked into fixed serial parallel reliability redundancy allocation issues followed by using an innovative hybrid optimization technique to find the best possible allocation for peak dependability. We then measured our findings against other research.
Abstract（参考訳）: Serial-parallelの冗長性は、クラウドコンピューティングでサービスとシステムが利用できることを保証する信頼性の高い方法である。この方法は、同一のシステムまたはプログラムのコピーを作成することを含み、残る1つだけがアクティブである。エラーが発生した場合、非アクティブコピーはすぐにバックアップとしてステップインでき、継続的なパフォーマンスと未中断の操作を提供する。このアプローチは並列冗長( parallel redundancy)と呼ばれ、それ以外はアクティブな冗長(active-active redundancy)と呼ばれ、戦略に関しては例外的である。すべて一度に実行されるシステムやサービスの複製を生成します。このフォールトトレランスを実行することで、1つのコピーが失敗すると、適切に機能するすべてのレプリカにワークロードを分散させることができる。信頼性の割り当ては、システムの機能と、必要な可用性とフォールトトレランスに依存します。システムやサービスの信頼性を高めるために、シリアル冗長性や並列冗長性を適用することができる。この概念がいかにうまく機能するかを実証するために、固定並列信頼性の冗長性割り当て問題について検討し、その後に革新的なハイブリッド最適化手法を用いてピーク依存度に最適なアロケーションを求める。研究の結果を他の研究と比較した。

関連論文リスト

Optimized Disaster Recovery for Distributed Storage Systems: Lightweight Metadata Architectures to Overcome Cryptographic Hashing Bottleneck [0.0]
本稿では, 完全ないし部分的再ハッシュが避けられない動作条件を特徴付ける。提案フレームワークは,DR中の瞬時デルタが可能なコンテンツ解析を経時的に依存するデータブロックに対して,暗号オーバーヘッドを伴わずに,グローバルにユニークな複合識別子を割り当てる。
論文参考訳（メタデータ） (2026-02-23T21:34:25Z)
Learning to Share: Selective Memory for Efficient Parallel Agentic Systems [49.78267008828593]
エージェントシステムは、反復的に推論する複数のエージェントを調整することで複雑なタスクを解決し、ツールを呼び出し、中間結果を交換する。最近のアプローチでは、さまざまな推論の軌跡を探索するために、複数のエージェントチームが並行して運用されている。我々は並列エージェントフレームワークのための学習された共有メモリ機構であるLearning to Share (LTS)を提案する。
論文参考訳（メタデータ） (2026-02-05T18:20:21Z)
HALO: Semantic-Aware Distributed LLM Inference in Lossy Edge Network [50.33808558714122]
エッジでの大規模言語モデル(LLM)推論は、ユーザのプライバシを保護すると同時に、サービスの応答性を促進する。損失エッジネットワークにおける分散LLM推論を向上する新しいフレームワークであるHALOを提案する。 Raspberry Piクラスタによる実験の結果、HALOは信頼性の低いネットワーク条件下でLLaMAシリーズLLMの3.41倍のエンドツーエンドのスピードアップを達成した。
論文参考訳（メタデータ） (2026-01-16T07:37:23Z)
PowerGrow: Feasible Co-Growth of Structures and Dynamics for Power Grid Synthesis [75.14189839277928]
本稿では,運用効率を維持しながら計算オーバーヘッドを大幅に削減する,共同生成フレームワークPowerGrowを提案する。ベンチマーク設定による実験では、PowerGrowはフィデリティと多様性において、事前の拡散モデルよりも優れていた。これは、運用上有効で現実的な電力グリッドシナリオを生成する能力を示している。
論文参考訳（メタデータ） (2025-08-29T01:47:27Z)
ASPD: Unlocking Adaptive Serial-Parallel Decoding by Exploring Intrinsic Parallelism in LLMs [34.477777651648914]
大規模言語モデル(LLM)は、自動回帰デコードパラダイムのため、推論遅延の大きな問題を生じさせる。本稿では、並列化可能なデータの自動構築と効率的な並列化機構の2つの課題に対処する適応シリアル-パラレルデコーディング(ASPD)を提案する。我々のフレームワークは、効率的なLCM並列推論のための基盤となるベンチマークを設定し、AIによるカスタマーサービスボットや回答検索エンジンのようなレイテンシに敏感なアプリケーションへのデプロイの道を開く。
論文参考訳（メタデータ） (2025-08-12T12:35:55Z)
Walrus: An Efficient Decentralized Storage Network [6.053171723478456]
Walrusは、複数の技術革新を通じて制限に対処する、分散化されたブロブストレージシステムである。 RedStuffは、4.5倍のレプリケーション係数で高いセキュリティを実現する2次元消去符号化プロトコルである。 Walrusはまた、ストレージノードチャーンを効率的に処理する、新しいマルチステージエポック変更プロトコルも導入している。
論文参考訳（メタデータ） (2025-05-08T16:06:41Z)
RL-TIME: Reinforcement Learning-based Task Replication in Multicore Embedded Systems [6.184592401883041]
タスクレプリケーションは、タスクの実行を重複させて一時的な障害と永続的な障害を処理することで、信頼性を向上させることができる。既存の設計時メソッドは通常、最悪のケース条件に基づいてレプリカの数を選択する。実システム条件に応じてレプリカ数を動的に決定する強化学習に基づくRL-TIMEを提案する。
論文参考訳（メタデータ） (2025-03-16T22:31:25Z)
Employing Software Diversity in Cloud Microservices to Engineer Reliable and Performant Systems [2.412158290827225]
本研究は,システムの信頼性と性能を同時に向上するために,ソフトウェアの多様性を活用することを提案する。私たちの仕事の土台は信頼性基準の導出です。目標は、より信頼性の高いバージョンに対して、可能な限り多くのバージョンを保存しながら、より高いレプリカ数を維持することである。
論文参考訳（メタデータ） (2024-07-10T00:34:39Z)
Digital Twin-Assisted Data-Driven Optimization for Reliable Edge Caching in Wireless Networks [60.54852710216738]
我々はD-RECと呼ばれる新しいデジタルツインアシスト最適化フレームワークを導入し、次世代無線ネットワークにおける信頼性の高いキャッシュを実現する。信頼性モジュールを制約付き決定プロセスに組み込むことで、D-RECは、有利な制約に従うために、アクション、報酬、状態を適応的に調整することができる。
論文参考訳（メタデータ） (2024-06-29T02:40:28Z)
Training Through Failure: Effects of Data Consistency in Parallel Machine Learning Training [0.0]
本研究では,障害時の並列機械学習トレーニングにおけるデータ一貫性の緩和の影響について検討する。私たちの障害復旧戦略には、従来のチェックポイント、チェーンレプリケーション、新しいステートレスパラメータサーバアプローチが含まれています。
論文参考訳（メタデータ） (2024-06-08T18:31:56Z)
A Comprehensive Benchmarking Analysis of Fault Recovery in Stream Processing Frameworks [1.3398445165628463]
本稿では, クラウドネイティブ環境における障害復旧性能, 安定性, 回復時間に関する包括的解析を行う。以上の結果から,Flinkは最も安定しており,最高の障害回復の1つであることが示唆された。 K Kafka Streamsは適切なフォールトリカバリパフォーマンスと安定性を示しているが、イベントレイテンシは高い。
論文参考訳（メタデータ） (2024-04-09T10:49:23Z)
On the Role of Server Momentum in Federated Learning [85.54616432098706]
a)フェデレートラーニング(FL)において未探索な大量のモーメントスキームを網羅するサーバモーメントの一般的な枠組みを提案する。提案するフレームワークに対して厳密な収束解析を行う。
論文参考訳（メタデータ） (2023-12-19T23:56:49Z)
Iterative Sketching for Secure Coded Regression [66.53950020718021]
分散線形回帰を高速化する手法を提案する。具体的には、方程式の系の基礎をランダムに回転させ、次にサブサンプルブロックを回転させ、情報を同時に確保し、回帰問題の次元を小さくする。
論文参考訳（メタデータ） (2023-08-08T11:10:42Z)
Dual Generator Offline Reinforcement Learning [90.05278061564198]
オフラインのRLでは、学習したポリシーをデータに近づき続けることが不可欠である。実際には、GANベースのオフラインRL法は代替手法と同様に実行されていない。 2つのジェネレータを持つことにより、有効なGANベースのオフラインRL法が実現されるだけでなく、サポート制約を近似することも示している。
論文参考訳（メタデータ） (2022-11-02T20:25:18Z)
Learning Mean-Field Control for Delayed Information Load Balancing in Large Queuing Systems [26.405495663998828]
本研究では,多くのクライアント(ロードバランサ)と多数の並列キューで構成される遅延情報を備えたマルチエージェントロードバランシングシステムについて考察する。我々は、最適負荷分散ソリューションを見つけるためにポリシー勾配強化学習アルゴリズムを適用した。我々のアプローチはスケーラブルだが、Join-the-Shortest-Queue (JSQ)の最先端のパワー・オブ・ド・バリアントと比較すると、優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2022-08-09T13:47:19Z)
Layer-Wise Partitioning and Merging for Efficient and Scalable Deep Learning [16.38731019298993]
我々は、より優れたトレーニング性能を提供するために、新しいレイヤワイドパーティショニングとマージ、前方および後方パス並列フレームワークを提案している。実使用事例を実験的に評価したところ,提案手法は訓練速度において最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2022-07-22T11:47:34Z)
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search [76.73477450555046]
本稿では、ESの並列効率を最大化し、ポリシー勾配法と統合する非同期進化戦略強化学習(AES-RL)を提案する。具体的には、(1)ESとDRLを非同期にマージする新しいフレームワークを提案し、2)非同期、ES、DRLのすべての利点を利用できる様々な非同期更新方法を提案する。
論文参考訳（メタデータ） (2020-12-10T02:30:48Z)
Accelerating Feedforward Computation via Parallel Nonlinear Equation Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文参考訳（メタデータ） (2020-02-10T10:11:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。