論文の概要: Smells-sus: Sustainability Smells in IaC
- arxiv url: http://arxiv.org/abs/2501.07676v2
- Date: Mon, 20 Jan 2025 20:05:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:16:58.717244
- Title: Smells-sus: Sustainability Smells in IaC
- Title(参考訳): Smells-sus: IaCにおけるサステナビリティ・スメル
- Authors: Seif Kosbar, Mohammad Hamdaqa,
- Abstract要約: この研究は、広く採用されているInfrastructure as Code(IaC)ツールであるTerraformに焦点を当てている。
持続可能性嗅覚を7つ定義し,19人のIaC実践者を対象に調査を行った。
最も一般的な臭いはモノリシックインフラストラクチャであり、スクリプトの9.67%に現れる。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Practitioners use Infrastructure as Code (IaC) scripts to efficiently configure IT infrastructures through machine-readable definition files. However, during the development of these scripts, some code patterns or deployment choices may lead to sustainability issues like inefficient resource utilization or redundant provisioning for example. We call this type of patterns sustainability smells. These inefficiencies pose significant environmental and financial challenges, given the growing scale of cloud computing. This research focuses on Terraform, a widely adopted IaC tool. Our study involves defining seven sustainability smells and validating them through a survey with 19 IaC practitioners. We utilized a dataset of 28,327 Terraform scripts from 395 open-source repositories. We performed a detailed qualitative analysis of a randomly sampled 1,860 Terraform scripts from the original dataset to identify code patterns that correspond to the sustainability smells and used the other 26,467 Terraform scripts to study the prevalence of the defined sustainability smells. Our results indicate varying prevalence rates of these smells across the dataset. The most prevalent smell is Monolithic Infrastructure, which appears in 9.67\% of the scripts. Additionally, our findings highlight the complexity of conducting root cause analysis for sustainability issues, as these smells often arise from a confluence of script structures, configuration choices, and deployment contexts.
- Abstract(参考訳): 実践者はInfrastructure as Code (IaC)スクリプトを使用して、マシン可読定義ファイルを通じてITインフラストラクチャを効率的に構成する。
しかしながら、これらのスクリプトの開発中、いくつかのコードパターンやデプロイメントの選択は、非効率なリソース利用や冗長なプロビジョニングといった持続可能性の問題を引き起こす可能性がある。
このようなパターンを持続可能性の匂いと呼びます。
これらの非効率性は、クラウドコンピューティングの規模が大きくなることを考えると、環境および財政上の大きな課題を引き起こす。
この研究は、広く採用されているIaCツールであるTerraformに焦点を当てている。
本研究は,7種類のサステナビリティの匂いを定義し,19名のIaC実践者を対象に調査を行った。
395のオープンソースリポジトリから28,327のTerraformスクリプトのデータセットを使用しました。
そこで,本研究では,無作為サンプリングした1,860個のTerraformスクリプトの詳細な定性解析を行い,持続可能性臭に対応するコードパターンを同定し,他の26,467個のTerraformスクリプトを用いて,定義した持続可能性臭の有病率について検討した。
以上の結果から,これらの嗅覚の出現頻度はデータセット全体で異なることがわかった。
最も一般的な臭いはモノリシックインフラストラクチャであり、スクリプトの9.67\%に現れる。
さらに本研究では,スクリプト構造や構成選択,デプロイメントコンテキストの相違から発生する,持続可能性問題に対する根本原因分析の複雑さも強調した。
関連論文リスト
- Querying Perception Streams with Spatial Regular Expressions [3.6814516646862683]
本研究では空間的および時間的データを含むストリーム上でのパターンマッチングのための新しいクエリ言語としてSpREを紹介する。
我々は、知覚データのためのオフラインおよびオンラインのパターンマッチングフレームワークとしてSTREMツールを開発した。
マッチングフレームワークを使用することで、296ms以内で20,000以上のマッチを見つけることができ、STREMをランタイム監視アプリケーションに適用できます。
論文 参考訳(メタデータ) (2024-11-08T20:15:27Z) - BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文 参考訳(メタデータ) (2024-10-01T15:11:24Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Enhancing Interpretability and Generalizability in Extended Isolation Forests [5.139809663513828]
ExIFFI (Extended isolated Forest Feature Importance) は、EIF(Extended isolated Forest)モデルによる予測を説明する手法である。
EIF+は、修正された分割戦略により、見えない異常を検出するモデルの能力を高めるように設計されている。
ExIFFIは、11の現実世界のデータセットのうち8つで、他の教師なしの解釈可能性メソッドよりも優れています。
論文 参考訳(メタデータ) (2023-10-09T07:24:04Z) - $\texttt{causalAssembly}$: Generating Realistic Production Data for
Benchmarking Causal Discovery [1.3048920509133808]
我々は、因果探索手法のベンチマークをサポートする半合成製造データを生成するシステムを構築した。
我々は、柔軟に推定し、条件分布を表すために分布ランダムな森林を用いる。
このライブラリを用いて、よく知られた因果探索アルゴリズムをベンチマークする方法を示す。
論文 参考訳(メタデータ) (2023-06-19T10:05:54Z) - GAN-based Tabular Data Generator for Constructing Synopsis in
Approximate Query Processing: Challenges and Solutions [0.0]
Approximate Query Processing (AQP) は、データ(シノプシス)の要約に基づいて、集約されたクエリに近似した回答を提供する技術である。
本研究では,AQPを用いて合成構築を行うことのできる表データ生成におけるGAN(Generative Adversarial Networks)の新規活用について検討する。
以上の結果から,データ駆動システムにおけるAQPの効率と有効性に変化をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-18T05:11:04Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。