論文の概要: A Roadmap towards Intelligent Operations for Reliable Cloud Computing
Systems
- arxiv url: http://arxiv.org/abs/2310.00677v1
- Date: Sun, 1 Oct 2023 14:08:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-10-23 05:27:16.224496
- Title: A Roadmap towards Intelligent Operations for Reliable Cloud Computing
Systems
- Title(参考訳): 信頼性の高いクラウドコンピューティングシステムのためのインテリジェントオペレーションのロードマップ
- Authors: Yintong Huo, Cheryl Lee, Jinyang Liu, Tianyi Yang, and Michael R. Lyu
- Abstract要約: 本稿では、クラウドの信頼性に影響を与える2つの主な課題、すなわち、内部要因と外部要因に焦点を当てる。
チケット管理、ログ管理、マルチモーダル分析、マイクロサービスレジリエンステストアプローチの4つの重要な側面から、これらの課題を解決するためのデータ駆動アプローチについて議論する。
- 参考スコア(独自算出の注目度): 30.952201576129056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing complexity and usage of cloud systems have made it challenging
for service providers to ensure reliability. This paper highlights two main
challenges, namely internal and external factors, that affect the reliability
of cloud microservices. Afterward, we discuss the data-driven approach that can
resolve these challenges from four key aspects: ticket management, log
management, multimodal analysis, and the microservice resilience testing
approach. The experiments conducted show that the proposed data-driven AIOps
solution significantly enhances system reliability from multiple angles.
- Abstract(参考訳): クラウドシステムの複雑さと使用の増大により、サービスプロバイダは信頼性を確保することが難しくなっている。
本稿では,クラウドマイクロサービスの信頼性に影響を与える2つの主な課題,すなわち内部的および外部的要因について紹介する。
その後、チケット管理、ログ管理、マルチモーダル分析、マイクロサービスレジリエンステストアプローチという4つの重要な側面から、これらの課題を解決するデータ駆動アプローチについて論じる。
実験により,提案するデータ駆動型aiopsソリューションは,複数の角度からシステムの信頼性を著しく向上することが示された。
関連論文リスト
- Blockchain-Enabled Routing for Zero-Trust Low-Altitude Intelligent Networks [77.17664010626726]
低高度インテリジェントネットワーク(LAIN)における複数のUAVクラスタによるルーティングに焦点を当てる。
潜在的な脅威によるダメージを最小限に抑えるため,ソフトウェア定義の周辺技術とブロックチェーン技術を用いたゼロトラストアーキテクチャを提案する。
提案手法は,平均E2E遅延を59%削減し,TSRを29%改善することを示した。
論文 参考訳(メタデータ) (2026-02-27T04:30:35Z) - Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - From Observability Data to Diagnosis: An Evolving Multi-agent System for Incident Management in Cloud Systems [9.492890623016335]
OpsAgentは、インシデント管理のための軽量で自己進化型のマルチエージェントシステムである。
トレーニング不要のデータプロセッサを使用して、異種可観測データを構造化されたテキスト記述に変換する。
OpsAgentは一般化可能で、解釈可能で、コスト効率が高く、自己進化的です。
論文 参考訳(メタデータ) (2025-10-28T07:38:15Z) - An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。
AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。
AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2025-10-19T03:59:25Z) - Higher Satisfaction, Lower Cost: A Technical Report on How LLMs Revolutionize Meituan's Intelligent Interaction Systems [67.18731675163589]
本稿では,産業アプリケーションに適したインテリジェントインタラクションシステムであるWOWServiceを紹介する。
LLMとマルチエージェントアーキテクチャの統合により、WOWServiceは自律的なタスク管理と協調的な問題解決を可能にします。
WOWServiceはMeituan App上にデプロイされ、主要なメトリクスの大幅な向上を実現している。
論文 参考訳(メタデータ) (2025-10-15T08:35:51Z) - Walk the Talk: Is Your Log-based Software Reliability Maintenance System Really Reliable? [18.587739647424716]
本稿では、サービス提供者の信頼を得るためのモデルに対する信頼性基準、診断忠実度を定義する。
本稿では,忠実なログに基づく異常検出システムであるFaithLogを提案する。
論文 参考訳(メタデータ) (2025-09-29T06:52:40Z) - CoRe-MMRAG: Cross-Source Knowledge Reconciliation for Multimodal RAG [53.950029990391066]
マルチモーダルRAG(CoRe-MMRAG)のためのクロスソース知識textbfReconciliation
本稿では,知識ソース間の不整合を効果的に解決する新しいエンドツーエンドフレームワークを提案する。
KB-VQAベンチマークの実験では、CoRe-MMRAGはベースライン法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-06-03T07:32:40Z) - Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning [69.64809103333839]
先行情報に対する問題の難易度を明示的にモデル化し,多モーダル推論における強化学習に基づく微調整の有効性を検証した。
提案手法は,2段階学習データのみを2K+0.6Kとする多モード数学的推論ベンチマークにおいて有意な性能を示す。
論文 参考訳(メタデータ) (2025-05-19T15:43:10Z) - Opportunistic Collaborative Planning with Large Vision Model Guided Control and Joint Query-Service Optimization [74.92515821144484]
オープンなシナリオで自動運転車をナビゲートすることは、目に見えない物体を扱うのが難しいため、課題である。
既存のソリューションは、一般化に苦しむ小さなモデルか、リソース集約的な大きなモデルに依存している。
本稿では,効率的なローカルモデルと強力なクラウドモデルをシームレスに統合するオポチュニティ協調計画(OCP)を提案する。
論文 参考訳(メタデータ) (2025-04-25T04:07:21Z) - Anomaly Detection in Large-Scale Cloud Systems: An Industry Case and Dataset [1.293050392312921]
我々は、IBM Cloud Consoleから4.5ヶ月以上にわたって収集された、IBM Cloudからの新しい高次元データセットを紹介します。
このデータセットは39,365行と117,448列のテレメトリデータからなる。
本稿では、異常検出のための機械学習モデルの応用を実演し、このプロセスで直面する重要な課題について論じる。
論文 参考訳(メタデータ) (2024-11-13T22:04:19Z) - Towards Resource-Efficient Federated Learning in Industrial IoT for Multivariate Time Series Analysis [50.18156030818883]
異常と欠落したデータは、産業応用における厄介な問題を構成する。
ディープラーニングによる異常検出が重要な方向として現れている。
エッジデバイスで収集されたデータは、ユーザのプライバシを含む。
論文 参考訳(メタデータ) (2024-11-06T15:38:31Z) - Blockchain-Based Trust and Transparency in Airline Reservation Systems using Microservices Architecture [1.03590082373586]
本研究は,分散データベースやトランザクションの永久記録,プログラムのコードを通じて実行されるトランザクション条項など,ブロックチェーン技術の主要なコンポーネントについて検討する。
その結果、コンセンサスプロセスと耐性データ生成の結果、予約のバリエーションが30%減少し、データ同期が向上した。
システムのアーキテクチャには1ポイントの障害はなく、信頼性は98%を超えている。
論文 参考訳(メタデータ) (2024-10-18T14:58:22Z) - Industry Perception of Security Challenges with Identity Access Management Solutions [0.0]
本研究は、受益者の視点から、IAMソリューションに関する現在の認識とセキュリティ問題の概要を明らかにすることを目的としている。
クラウドベースのIAMソリューションの主な課題は、デフォルト設定、サービスアカウントのような非Human Identitiesの非Human Identitiesの管理、粗悪な証明書管理、粗悪なAPI設定、限定的なログ分析である。
対照的に、オンプレミスソリューションの課題は、マルチファクタ認証、安全でないデフォルト設定、IAMソリューションを安全に管理するために必要なスキルセットの欠如、パスワードポリシーの貧弱化、未パッチの脆弱性、シングルサインの妥協などである。
論文 参考訳(メタデータ) (2024-08-20T08:19:58Z) - Insights on Microservice Architecture Through the Eyes of Industry Practitioners [39.58317527488534]
マイクロサービスアーキテクチャの採用は、ここ数年で大幅に増加しています。
本研究では,モノリシックなレガシーシステムからの移行に伴うモチベーション,活動,課題について検討する。
論文 参考訳(メタデータ) (2024-08-19T21:56:58Z) - A Comprehensive Survey on Root Cause Analysis in (Micro) Services: Methodologies, Challenges, and Trends [12.814440316872748]
本調査は根本原因分析(RCA)技術に関する総合的かつ構造化されたレビューを提供することを目的としている。
メトリクス、トレース、ログ、マルチモデルデータを含む方法論を探求する。
論文 参考訳(メタデータ) (2024-07-23T11:02:49Z) - Effective Intrusion Detection in Heterogeneous Internet-of-Things Networks via Ensemble Knowledge Distillation-based Federated Learning [52.6706505729803]
我々は、分散化された侵入検知システムの共有モデル(IDS)を協調訓練するために、フェデレートラーニング(FL)を導入する。
FLEKDは従来のモデル融合法よりも柔軟な凝集法を実現する。
実験の結果,提案手法は,速度と性能の両面で,局所訓練と従来のFLよりも優れていた。
論文 参考訳(メタデータ) (2024-01-22T14:16:37Z) - Edge Intelligence Over the Air: Two Faces of Interference in Federated
Learning [95.31679010587473]
フェデレートされたエッジ学習は、次世代無線ネットワークにおけるインテリジェンスの実現の基盤として考えられている。
本稿では,無線によるエッジ学習システムにおける干渉の肯定的および否定的影響について概説する。
論文 参考訳(メタデータ) (2023-06-17T09:04:48Z) - MMRNet: Improving Reliability for Multimodal Object Detection and
Segmentation for Bin Picking via Multimodal Redundancy [68.7563053122698]
マルチモーダル冗長性(MMRNet)を用いた信頼度の高いオブジェクト検出・分割システムを提案する。
これは、マルチモーダル冗長の概念を導入し、デプロイ中のセンサ障害問題に対処する最初のシステムである。
システム全体の出力信頼性と不確実性を測定するために,すべてのモダリティからの出力を利用する新しいラベルフリーマルチモーダル整合性(MC)スコアを提案する。
論文 参考訳(メタデータ) (2022-10-19T19:15:07Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。