論文の概要: Reproduction Research of FSA-Benchmark
- arxiv url: http://arxiv.org/abs/2501.14739v3
- Date: Tue, 04 Feb 2025 20:42:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:24:07.506033
- Title: Reproduction Research of FSA-Benchmark
- Title(参考訳): FSAベンチマークの再現研究
- Authors: Joshua Ludolf, Yesmin Reyna-Hernandez, Matthew Trevino,
- Abstract要約: フェールスローディスクは、最終的にフェールする前に徐々にパフォーマンスが低下する。
アウトライトディスクの障害とは異なり、フェールスロー条件は長期にわたって検出されず、システムパフォーマンスとユーザエクスペリエンスに大きな影響を与えます。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In the current landscape of big data, the reliability and performance of storage systems are essential to the success of various applications and services. as data volumes continue to grow exponentially, the complexity and scale of the storage infrastructures needed to manage this data also increase. a significant challenge faced by data centers and storage systems is the detection and management of fail-slow disks that experience a gradual decline in performance before ultimately failing. Unlike outright disk failures, fail-slow conditions can go undetected for prolonged periods, leading to considerable impacts on system performance and user experience.
- Abstract(参考訳): 現在のビッグデータの世界では、様々なアプリケーションやサービスの成功にストレージシステムの信頼性と性能が不可欠である。
データボリュームが指数関数的に増加するにつれて、このデータを管理するのに必要なストレージインフラストラクチャの複雑さと規模も増加します。
データセンタとストレージシステムで直面する大きな課題は、最終的に失敗する前に徐々にパフォーマンスが低下する、フェールスローディスクの検出と管理である。
アウトライトディスクの障害とは異なり、フェールスロー条件は長期にわたって検出されず、システムパフォーマンスとユーザエクスペリエンスに大きな影響を与えます。
関連論文リスト
- Evaluating Fault Tolerance and Scalability in Distributed File Systems: A Case Study of GFS, HDFS, and MinIO [0.0]
分散ファイルシステム(DFS)は、スケーラビリティ、フォールトトレランス、データアクセシビリティのメリットを提供する、複数のサーバにわたる巨大なデータセットを管理するために不可欠である。
本稿では、Google File System(GFS)、Hadoop Distributed File System(HDFS)、MinIOの3つのDFSを総合的に評価する。
詳細な分析を通じて、これらのシステムがデータの冗長性、サーバ障害、クライアントアクセスプロトコルをどのように扱うか、動的で大規模環境における信頼性を確実に評価する。
論文 参考訳(メタデータ) (2025-02-04T03:52:45Z) - Towards Resource-Efficient Federated Learning in Industrial IoT for Multivariate Time Series Analysis [50.18156030818883]
異常と欠落したデータは、産業応用における厄介な問題を構成する。
ディープラーニングによる異常検出が重要な方向として現れている。
エッジデバイスで収集されたデータは、ユーザのプライバシを含む。
論文 参考訳(メタデータ) (2024-11-06T15:38:31Z) - Digital Twin-Assisted Data-Driven Optimization for Reliable Edge Caching in Wireless Networks [60.54852710216738]
我々はD-RECと呼ばれる新しいデジタルツインアシスト最適化フレームワークを導入し、次世代無線ネットワークにおける信頼性の高いキャッシュを実現する。
信頼性モジュールを制約付き決定プロセスに組み込むことで、D-RECは、有利な制約に従うために、アクション、報酬、状態を適応的に調整することができる。
論文 参考訳(メタデータ) (2024-06-29T02:40:28Z) - Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - Design and Implementation of an Automated Disaster-recovery System for a
Kubernetes Cluster Using LSTM [0.0]
本研究では,管理用プレートフォームとバックアップ・修復ツールを統合するシステム構造について紹介する。
実験の結果,ヒトの介入なしに15秒以内に修復処理を行い,迅速な回復を可能にした。
論文 参考訳(メタデータ) (2024-02-05T12:00:31Z) - Towards Learned Predictability of Storage Systems [0.0]
ストレージシステムは、データセンターの基本的なビルディングブロックになっている。
ストレージの普及と関心にもかかわらず、信頼性のあるストレージシステムの設計と実装は依然として困難である。
ストレージシステムの予測可能性に向けて、近年様々なメカニズムとフィールド研究が提案されている。
3つの代表的な研究成果に基づき、この分野で機械学習をどのように適用すべきかを論じる。
論文 参考訳(メタデータ) (2023-07-30T17:53:08Z) - Challenges and Solutions to Build a Data Pipeline to Identify Anomalies
in Enterprise System Performance [3.037408957267527]
MLに基づく異常検出システムにおけるデータ活用の課題について論じる。
これらの課題に対処することで、パフォーマンス異常検出モデルの精度を30%向上するだけでなく、モデルの性能が経時的に劣化しないことを確実にする。
論文 参考訳(メタデータ) (2021-12-13T22:30:07Z) - Remaining Useful Life Estimation of Hard Disk Drives using Bidirectional
LSTM Networks [0.0]
本稿では、運用障害に関連する有意義な属性を抽出し、健康統計データを前処理する方法について紹介する。
健康指標の時間経過を学習し,バニラLSTMおよびランダムフォレストモデルに対してベースライン化するために,複数日間の振り返り期間を持つ双方向LSTMを用いている。
本手法では,60日前のテストデータから,ディスク障害の発生を96.4%の精度で予測できる。
論文 参考訳(メタデータ) (2021-09-11T19:26:07Z) - An Analysis of Distributed Systems Syllabi With a Focus on
Performance-Related Topics [65.86247008403002]
我々は、トップコンピュータサイエンスプログラムから51の現在(2019-2020)の分散システムシラビのデータセットを分析した。
本研究では,DSコースで言及されているインフラの規模を,小規模なクライアントサーバシステムからクラウドスケール,ピアツーピア,グローバルスケールシステムまで検討する。
論文 参考訳(メタデータ) (2021-03-02T16:49:09Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。