Fugu-MT 論文翻訳(概要): ChaosEater: Fully Automating Chaos Engineering with Large Language Models

論文の概要: ChaosEater: Fully Automating Chaos Engineering with Large Language Models

arxiv url: http://arxiv.org/abs/2501.11107v2
Date: Wed, 16 Apr 2025 03:33:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-17 20:12:20.920747
Title: ChaosEater: Fully Automating Chaos Engineering with Large Language Models
Title（参考訳）: ChaosEater: 大規模言語モデルによるカオスエンジニアリングの完全自動化
Authors: Daisuke Kikuta, Hiroki Ikeuchi, Kengo Tajiri,
Abstract要約: Chaos Engineering(CE)は、分散システムのレジリエンスを改善するための技術である。手動操作のコストを削減するため,CE操作全体を自動化したChaosEaterを提案する。
参考スコア（独自算出の注目度）: 1.7034420812099471
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Chaos Engineering (CE) is an engineering technique aimed at improving the resiliency of distributed systems. It involves artificially injecting specific failures into a distributed system and observing its behavior in response. Based on the observation, the system can be proactively improved to handle those failures. Recent CE tools implement the automated execution of predefined CE experiments. However, defining these experiments and improving the system based on the experimental results still remain manual. To reduce the costs of the manual operations, we propose ChaosEater, a system for automating the entire CE operations with Large Language Models (LLMs). It predefines the agentic workflow according to a systematic CE cycle and assigns subdivided operations within the workflow to LLMs. ChaosEater targets CE for Kubernetes systems, which are managed through code (i.e., Infrastructure as Code). Therefore, the LLMs in ChaosEater perform software engineering tasks to complete CE cycles, including requirement definition, code generation, debugging, and testing. We evaluate ChaosEater through case studies on both small and large Kubernetes systems. The results demonstrate that it stably completes reasonable single CE cycles with significantly low time and monetary costs. The CE cycles are also qualitatively validated by human engineers and LLMs.
Abstract（参考訳）: Chaos Engineering(CE)は、分散システムのレジリエンスを改善するための技術である。特定の障害を分散システムに人工的に注入し、その振る舞いを応答で観察する。この観測に基づいて、システムはこれらの障害に対処するために積極的に改善することができる。最近のCEツールは、事前定義されたCE実験の自動実行を実装している。しかし、これらの実験を定義し、実験結果に基づいてシステムを改善することは、まだ手作業のままである。手動操作のコストを削減するため,大規模言語モデル(LLM)を用いたCE操作全体を自動化するシステムChaosEaterを提案する。組織的なCEサイクルに従ってエージェントワークフローを事前定義し、ワークフロー内で分割された操作をLSMに割り当てる。 ChaosEaterは、コード(インフラストラクチャ・アズ・コード)を通じて管理されるKubernetesシステムのCEをターゲットにしている。したがって、ChaosEaterのLLMは、要件定義、コード生成、デバッグ、テストを含むCEサイクルを完成させるためのソフトウェアエンジニアリングタスクを実行する。小規模および大規模Kubernetesシステムのケーススタディを通じてChaosEaterを評価した。その結果, 比較的低い時間と金銭的コストで, 合理的なCEサイクルを安定的に完了できることが示唆された。 CEサイクルは、人間の技術者やLLMによって定性的に検証される。

関連論文リスト

BitsAI-Fix: LLM-Driven Approach for Automated Lint Error Resolution in Practice [11.767390004985979]
BitsAI-FixはLarge Language Models (LLM)に基づく自動リントエラー修復ワークフローである。 ByteDanceのプロダクションデプロイメントでは、5,000人以上のエンジニアをサポートし、12,000以上の静的解析問題を解決し、約85%の修正精度を達成し、毎週1,000人のアクティブアダプターが参加しています。
論文参考訳（メタデータ） (2025-08-05T14:17:30Z)
Design Automation in Quantum Error Correction [2.089191490381739]
実用的フォールトトレラント量子コンピューティング(FTQC)を支える量子エラー補正(QEC) QECプロトコルは、しきい値以下の論理誤差率を抑え、信頼性の高い操作を保証するために必須である。したがって、QECフローにおける設計の自動化は重要であり、自動合成、トランスパイル、レイアウト、誤り訂正回路の検証を可能にする。
論文参考訳（メタデータ） (2025-07-16T13:59:38Z)
Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文参考訳（メタデータ） (2025-07-03T11:20:22Z)
Training Language Models to Generate Quality Code with Program Analysis Feedback [66.0854002147103]
大規模言語モデル(LLM)によるコード生成は、ますます本番環境で採用されているが、コード品質の保証には失敗している。実運用品質のコードを生成するためにLLMにインセンティブを与える強化学習フレームワークであるREALを提案する。
論文参考訳（メタデータ） (2025-05-28T17:57:47Z)
MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。 MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文参考訳（メタデータ） (2025-05-21T00:56:09Z)
AutoLoop: Fast Visual SLAM Fine-tuning through Agentic Curriculum Learning [1.282543877006303]
本稿では、自動カリキュラム学習と視覚SLAMシステムのための効率的な微調整を組み合わせた新しいアプローチであるAutoLoopを提案する。本手法では, DDPG (Deep Deterministic Policy Gradient) エージェントを用いて, トレーニング中のループ閉鎖重量を動的に調整する。 TartanAirでトレーニングを行い、KITTI、EuRoC、ICL-NUIM、TUM RGB-Dを含む複数のベンチマークで検証した結果、AutoLoopは同等または優れたパフォーマンスを達成できた。
論文参考訳（メタデータ） (2025-01-15T21:22:09Z)
LABIIUM: AI-Enhanced Zero-configuration Measurement Automation System [0.0]
本稿では,実験の合理化とユーザの生産性向上を目的としたAIによる計測自動化システムであるLABIiumを紹介する。 Lab-Automation-Measurement Bridges (LAMBs)はVSCodeやPythonといった標準ツールを使ったシームレスなインスツルメンタ接続を可能にし、セットアップのオーバーヘッドをなくす。この評価は、LABIiumが研究室の生産性を高め、研究と産業におけるデジタルトランスフォーメーションを支援する能力を強調している。
論文参考訳（メタデータ） (2024-12-07T00:15:24Z)
Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文参考訳（メタデータ） (2024-12-05T18:58:27Z)
zsLLMCode: An Effective Approach for Code Embedding via LLM with Zero-Shot Learning [6.976968804436321]
本稿では,大言語モデル(LLM)と文埋め込みモデルを用いて,新たなゼロショット手法であるzsLLMCodeを提案する。その結果,最先端の教師なしアプローチに対する提案手法の有効性と優位性を実証した。
論文参考訳（メタデータ） (2024-09-23T01:03:15Z)
A Roadmap Towards Automated and Regulated Robotic Systems [4.6015001632772545]
我々は、AIの非規制生成プロセスが低レベルのタスクに適合していると主張している。完全自動化・制御されたロボットシステムを実現するためのロードマップを提案する。
論文参考訳（メタデータ） (2024-03-21T00:14:53Z)
Control and Automation for Industrial Production Storage Zone: Generation of Optimal Route Using Image Processing [49.1574468325115]
本稿では,DIPを用いた生産ラインモデルのゾーンに対する産業自動化手法の開発に焦点をあてる。新カスケード法は、それぞれの段階を適切な方法で定義し、関連する手法を開発に含めることを可能にした。システムはOpenCVライブラリをベースとしており、Java言語に基づいたオブジェクト指向プログラミング(OOP)プラットフォーム上に実装された人工視覚に焦点を当てたツールである。
論文参考訳（メタデータ） (2024-03-15T06:50:19Z)
E2E-AT: A Unified Framework for Tackling Uncertainty in Task-aware End-to-end Learning [9.741277008050927]
本稿では,機械学習モデルの入力特徴空間と制約付き最適化モデルの両方で生じる不確実性をカバーする統一フレームワークを提案する。トレーニング中にCOの不確かさを無視することは、一般化エラーの新たな引き金となる。このフレームワークはロバストな最適化問題として記述され、エンド・ツー・エンドの対角訓練(E2E-AT)によって現実的に解決されている。
論文参考訳（メタデータ） (2023-12-17T02:23:25Z)
TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文参考訳（メタデータ） (2023-11-30T18:02:44Z)
Exploring Continual Learning for Code Generation Models [80.78036093054855]
継続的学習(CL)は、コードドメインの中でまだ過小評価されていない重要な側面である。コード生成,翻訳,要約,改良など,幅広いタスクをカバーするCodeTask-CLというベンチマークを導入する。即時選択機構の不安定な訓練により,プロンプトプール (PP) などの有効手法が破滅的な忘れ込みに悩まされることが判明した。
論文参考訳（メタデータ） (2023-07-05T16:58:39Z)
CHESS: A Framework for Evaluation of Self-adaptive Systems based on Chaos Engineering [0.6875312133832078]
自己適応型および自己修復型システムの正しい行動を評価する必要性が高まっている。自己適応型・自己修復型システムの体系的評価方法が欠如している。本稿では,カオスエンジニアリングに基づくフォールトインジェクションによる自己適応型・自己修復型システムの評価により,このギャップに対処するCHESSを提案する。
論文参考訳（メタデータ） (2023-03-13T17:00:55Z)
SIAD: Self-supervised Image Anomaly Detection System [18.410995759781006]
本稿では,SsaAと呼ばれる自動アノテーションシステムについて概説する。ユーザフレンドリーなWebベースのインターフェースにより、SsaAは教師なしアルゴリズムと教師なしアルゴリズムの両方を統合するのに非常に便利である。
論文参考訳（メタデータ） (2022-08-08T14:26:35Z)
CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning [92.36705236706678]
CodeRLは、事前訓練されたLMと深層強化学習によるプログラム合成タスクのための新しいフレームワークである。推論中、我々は重要なサンプリング戦略を持つ新しい生成手順を導入する。モデルバックボーンについては,CodeT5のエンコーダデコーダアーキテクチャを拡張し,学習目標を拡張した。
論文参考訳（メタデータ） (2022-07-05T02:42:15Z)
OSCAR: Data-Driven Operational Space Control for Adaptive and Robust Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2021-10-02T01:21:38Z)
Deep Neural Network Approach to Estimate Early Worst-Case Execution Time [10.272133976201763]
WCET(Worst-Case Execution Time)は、サイバー物理・安全批判システムを開発する上で最も重要である。本稿では,ハードウェアアーキテクチャとコンパイラの近似予測モデルとしてDeep Neural Networksを用いた初期のWCETを推定する。
論文参考訳（メタデータ） (2021-07-28T06:32:02Z)
Online Learning of Competitive Equilibria in Exchange Economies [94.24357018178867]
経済学では、複数の有理エージェント間の資源不足の共有は古典的な問題である。エージェントの好みを学習するためのオンライン学習機構を提案する。数値シミュレーションにより,本機構の有効性を実証する。
論文参考訳（メタデータ） (2021-06-11T21:32:17Z)
Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文参考訳（メタデータ） (2021-01-11T15:54:48Z)
Induction and Exploitation of Subgoal Automata for Reinforcement Learning [75.55324974788475]
本稿では,Regressed Learning (RL)タスクにおけるサブゴールの学習と活用のためのISAを提案する。 ISAは、タスクのサブゴールによってエッジがラベル付けされたオートマトンであるサブゴールオートマトンを誘導することで強化学習をインターリーブする。サブゴールオートマトンはまた、タスクの完了を示す状態と、タスクが成功せずに完了したことを示す状態の2つの特別な状態で構成されている。
論文参考訳（メタデータ） (2020-09-08T16:42:55Z)
Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文参考訳（メタデータ） (2020-06-21T17:14:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。