論文の概要: ChaosEater: Fully Automating Chaos Engineering with Large Language Models
- arxiv url: http://arxiv.org/abs/2501.11107v2
- Date: Wed, 16 Apr 2025 03:33:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 20:12:20.920747
- Title: ChaosEater: Fully Automating Chaos Engineering with Large Language Models
- Title(参考訳): ChaosEater: 大規模言語モデルによるカオスエンジニアリングの完全自動化
- Authors: Daisuke Kikuta, Hiroki Ikeuchi, Kengo Tajiri,
- Abstract要約: Chaos Engineering(CE)は、分散システムのレジリエンスを改善するための技術である。
手動操作のコストを削減するため,CE操作全体を自動化したChaosEaterを提案する。
- 参考スコア(独自算出の注目度): 1.7034420812099471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chaos Engineering (CE) is an engineering technique aimed at improving the resiliency of distributed systems. It involves artificially injecting specific failures into a distributed system and observing its behavior in response. Based on the observation, the system can be proactively improved to handle those failures. Recent CE tools implement the automated execution of predefined CE experiments. However, defining these experiments and improving the system based on the experimental results still remain manual. To reduce the costs of the manual operations, we propose ChaosEater, a system for automating the entire CE operations with Large Language Models (LLMs). It predefines the agentic workflow according to a systematic CE cycle and assigns subdivided operations within the workflow to LLMs. ChaosEater targets CE for Kubernetes systems, which are managed through code (i.e., Infrastructure as Code). Therefore, the LLMs in ChaosEater perform software engineering tasks to complete CE cycles, including requirement definition, code generation, debugging, and testing. We evaluate ChaosEater through case studies on both small and large Kubernetes systems. The results demonstrate that it stably completes reasonable single CE cycles with significantly low time and monetary costs. The CE cycles are also qualitatively validated by human engineers and LLMs.
- Abstract(参考訳): Chaos Engineering(CE)は、分散システムのレジリエンスを改善するための技術である。
特定の障害を分散システムに人工的に注入し、その振る舞いを応答で観察する。
この観測に基づいて、システムはこれらの障害に対処するために積極的に改善することができる。
最近のCEツールは、事前定義されたCE実験の自動実行を実装している。
しかし、これらの実験を定義し、実験結果に基づいてシステムを改善することは、まだ手作業のままである。
手動操作のコストを削減するため,大規模言語モデル(LLM)を用いたCE操作全体を自動化するシステムChaosEaterを提案する。
組織的なCEサイクルに従ってエージェントワークフローを事前定義し、ワークフロー内で分割された操作をLSMに割り当てる。
ChaosEaterは、コード(インフラストラクチャ・アズ・コード)を通じて管理されるKubernetesシステムのCEをターゲットにしている。
したがって、ChaosEaterのLLMは、要件定義、コード生成、デバッグ、テストを含むCEサイクルを完成させるためのソフトウェアエンジニアリングタスクを実行する。
小規模および大規模Kubernetesシステムのケーススタディを通じてChaosEaterを評価した。
その結果, 比較的低い時間と金銭的コストで, 合理的なCEサイクルを安定的に完了できることが示唆された。
CEサイクルは、人間の技術者やLLMによって定性的に検証される。
関連論文リスト
- AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning [1.282543877006303]
本稿では、自動カリキュラム学習と視覚SLAMシステムのための効率的な微調整を組み合わせた新しいアプローチであるAutoLoopを提案する。
本手法では, DDPG (Deep Deterministic Policy Gradient) エージェントを用いて, トレーニング中のループ閉鎖重量を動的に調整する。
TartanAirでトレーニングを行い、KITTI、EuRoC、ICL-NUIM、TUM RGB-Dを含む複数のベンチマークで検証した結果、AutoLoopは同等または優れたパフォーマンスを達成できた。
論文 参考訳(メタデータ) (2025-01-15T21:22:09Z) - LABIIUM: AI-Enhanced Zero-configuration Measurement Automation System [0.0]
本稿では,実験の合理化とユーザの生産性向上を目的としたAIによる計測自動化システムであるLABIiumを紹介する。
Lab-Automation-Measurement Bridges (LAMBs)はVSCodeやPythonといった標準ツールを使ったシームレスなインスツルメンタ接続を可能にし、セットアップのオーバーヘッドをなくす。
この評価は、LABIiumが研究室の生産性を高め、研究と産業におけるデジタルトランスフォーメーションを支援する能力を強調している。
論文 参考訳(メタデータ) (2024-12-07T00:15:24Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - zsLLMCode: An Effective Approach for Code Embedding via LLM with Zero-Shot Learning [6.976968804436321]
本稿では,大言語モデル(LLM)と文埋め込みモデルを用いて,新たなゼロショット手法であるzsLLMCodeを提案する。
その結果,最先端の教師なしアプローチに対する提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-09-23T01:03:15Z) - A Roadmap Towards Automated and Regulated Robotic Systems [4.6015001632772545]
我々は、AIの非規制生成プロセスが低レベルのタスクに適合していると主張している。
完全自動化・制御されたロボットシステムを実現するためのロードマップを提案する。
論文 参考訳(メタデータ) (2024-03-21T00:14:53Z) - Control and Automation for Industrial Production Storage Zone: Generation of Optimal Route Using Image Processing [49.1574468325115]
本稿では,DIPを用いた生産ラインモデルのゾーンに対する産業自動化手法の開発に焦点をあてる。
新カスケード法は、それぞれの段階を適切な方法で定義し、関連する手法を開発に含めることを可能にした。
システムはOpenCVライブラリをベースとしており、Java言語に基づいたオブジェクト指向プログラミング(OOP)プラットフォーム上に実装された人工視覚に焦点を当てたツールである。
論文 参考訳(メタデータ) (2024-03-15T06:50:19Z) - E2E-AT: A Unified Framework for Tackling Uncertainty in Task-aware
End-to-end Learning [9.741277008050927]
本稿では,機械学習モデルの入力特徴空間と制約付き最適化モデルの両方で生じる不確実性をカバーする統一フレームワークを提案する。
トレーニング中にCOの不確かさを無視することは、一般化エラーの新たな引き金となる。
このフレームワークはロバストな最適化問題として記述され、エンド・ツー・エンドの対角訓練(E2E-AT)によって現実的に解決されている。
論文 参考訳(メタデータ) (2023-12-17T02:23:25Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - Exploring Continual Learning for Code Generation Models [80.78036093054855]
継続的学習(CL)は、コードドメインの中でまだ過小評価されていない重要な側面である。
コード生成,翻訳,要約,改良など,幅広いタスクをカバーするCodeTask-CLというベンチマークを導入する。
即時選択機構の不安定な訓練により,プロンプトプール (PP) などの有効手法が破滅的な忘れ込みに悩まされることが判明した。
論文 参考訳(メタデータ) (2023-07-05T16:58:39Z) - CHESS: A Framework for Evaluation of Self-adaptive Systems based on
Chaos Engineering [0.6875312133832078]
自己適応型および自己修復型システムの正しい行動を評価する必要性が高まっている。
自己適応型・自己修復型システムの体系的評価方法が欠如している。
本稿では,カオスエンジニアリングに基づくフォールトインジェクションによる自己適応型・自己修復型システムの評価により,このギャップに対処するCHESSを提案する。
論文 参考訳(メタデータ) (2023-03-13T17:00:55Z) - SIAD: Self-supervised Image Anomaly Detection System [18.410995759781006]
本稿では,SsaAと呼ばれる自動アノテーションシステムについて概説する。
ユーザフレンドリーなWebベースのインターフェースにより、SsaAは教師なしアルゴリズムと教師なしアルゴリズムの両方を統合するのに非常に便利である。
論文 参考訳(メタデータ) (2022-08-08T14:26:35Z) - CodeRL: Mastering Code Generation through Pretrained Models and Deep
Reinforcement Learning [92.36705236706678]
CodeRLは、事前訓練されたLMと深層強化学習によるプログラム合成タスクのための新しいフレームワークである。
推論中、我々は重要なサンプリング戦略を持つ新しい生成手順を導入する。
モデルバックボーンについては,CodeT5のエンコーダデコーダアーキテクチャを拡張し,学習目標を拡張した。
論文 参考訳(メタデータ) (2022-07-05T02:42:15Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Deep Neural Network Approach to Estimate Early Worst-Case Execution Time [10.272133976201763]
WCET(Worst-Case Execution Time)は、サイバー物理・安全批判システムを開発する上で最も重要である。
本稿では,ハードウェアアーキテクチャとコンパイラの近似予測モデルとしてDeep Neural Networksを用いた初期のWCETを推定する。
論文 参考訳(メタデータ) (2021-07-28T06:32:02Z) - Online Learning of Competitive Equilibria in Exchange Economies [94.24357018178867]
経済学では、複数の有理エージェント間の資源不足の共有は古典的な問題である。
エージェントの好みを学習するためのオンライン学習機構を提案する。
数値シミュレーションにより,本機構の有効性を実証する。
論文 参考訳(メタデータ) (2021-06-11T21:32:17Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z) - Induction and Exploitation of Subgoal Automata for Reinforcement
Learning [75.55324974788475]
本稿では,Regressed Learning (RL)タスクにおけるサブゴールの学習と活用のためのISAを提案する。
ISAは、タスクのサブゴールによってエッジがラベル付けされたオートマトンであるサブゴールオートマトンを誘導することで強化学習をインターリーブする。
サブゴールオートマトンはまた、タスクの完了を示す状態と、タスクが成功せずに完了したことを示す状態の2つの特別な状態で構成されている。
論文 参考訳(メタデータ) (2020-09-08T16:42:55Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。