論文の概要: A Defect Taxonomy for Infrastructure as Code: A Replication Study
- arxiv url: http://arxiv.org/abs/2505.01568v2
- Date: Wed, 07 May 2025 12:04:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 12:54:13.626365
- Title: A Defect Taxonomy for Infrastructure as Code: A Replication Study
- Title(参考訳): コードとしてのインフラストラクチャーの欠陥分類:重複研究
- Authors: Filipe Paiva, João Brunet, Thiago Emmanuel Pereira, Wendell Oliveira,
- Abstract要約: 以前の研究ではこのような分類法が開発されていたが、宣言的な言語であるPuppetのみに基づいていた。
この分類法がPulumi、Terraform CDK、AWS CDKといったプログラミング言語ベースのIaCツールに適用されるかどうかは不明のままである。
PL-IaCレポジトリの3,364件の欠陥関連コミットについて定性解析を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background: As Infrastructure as Code (IaC) becomes standard practice, ensuring the reliability of IaC scripts is essential. Defect taxonomies are valuable tools for this, offering a common language for issues and enabling systematic tracking. A significant prior study developed such a taxonomy, but based it exclusively on the declarative language Puppet. It remained unknown whether this taxonomy applies to programming language-based IaC (PL-IaC) tools like Pulumi, Terraform CDK, and AWS CDK. Aim: We replicated this foundational work to assess the generalizability of the taxonomy across a broader and more diverse landscape. Method: We performed qualitative analysis on 3,364 defect-related commits from 285 open-source PL-IaC repositories (PIPr dataset) to derive a PL-IaC-specific defect taxonomy. We then enhanced the ACID tool, originally developed for the prior study, to automatically classify and analyze defect distributions across an expanded dataset-447 open-source repositories and 94 proprietary projects from VTEX (e-commerce) and Nubank (financial). Results: Our research confirmed the same eight defect categories identified in the original study, with idempotency and security defects appearing infrequently but persistently across projects. Configuration Data defects maintain high frequency in both open-source and proprietary codebases. Conclusions: Our replication supports the generalizability of the original taxonomy, suggesting IaC development challenges surpass organizational boundaries. Configuration Data defects emerge as a persistent high-frequency problem, while idempotency and security defects remain important concerns despite lower frequency. These patterns appear consistent across open-source and proprietary projects, indicating they are fundamental to the IaC paradigm itself, transcending specific tools or project types.
- Abstract(参考訳): 背景: インフラストラクチャ・アズ・コード(IaC)が標準となるにつれて、IaCスクリプトの信頼性を保証することが不可欠です。
欠陥分類(defect taxonomies)は、問題に対する共通言語を提供し、体系的な追跡を可能にする、このツールにとって貴重なツールである。
重要な先行研究はそのような分類学を発展させたが、宣言的な言語であるPuppetのみに基づいていた。
この分類法が、Pulumi、Terraform CDK、AWS CDKといったプログラミング言語ベースのIaC(PL-IaC)ツールに適用されるかどうかは不明のままである。
Aim: 私たちはこの基礎研究を再現し、より広い、より多様な景観における分類学の一般化可能性を評価しました。
方法:285のPL-IaCレポジトリ(PIPrデータセット)から3,364件の欠陥関連コミットの質的分析を行い,PL-IaC固有の欠陥分類を導出した。
次に我々は、元々この研究のために開発されたACIDツールを拡張し、拡張されたデータセット-447オープンソースリポジトリと、VTEX(eコマース)とNubank(金融)の94のプロプライエタリプロジェクト間で、欠陥分散を自動的に分類し分析した。
結果:本研究で確認された8つの欠陥カテゴリは,イデオロシティとセキュリティの欠陥が稀に現れるが,プロジェクト全体にわたって持続的に現れることが確認された。
構成 データ欠陥は、オープンソースとプロプライエタリのコードベースの両方で高い頻度で維持される。
結論:我々の複製は,本来の分類の一般化性を支持し,IaC開発課題が組織の境界を超えることを示唆している。
構成 データ欠陥は永続的な高周波問題として現れるが、イデオロシティとセキュリティの欠陥は、低い周波数にもかかわらず重要な関心事である。
これらのパターンは、オープンソースおよびプロプライエタリなプロジェクト間で一貫性があり、IaCパラダイム自体の基本であり、特定のツールやプロジェクトタイプを超越していることを示している。
関連論文リスト
- Smells-sus: Sustainability Smells in IaC [0.0]
この研究は、広く採用されているInfrastructure as Code(IaC)ツールであるTerraformに焦点を当てている。
持続可能性嗅覚を7つ定義し,19人のIaC実践者を対象に調査を行った。
最も一般的な臭いはモノリシックインフラストラクチャであり、スクリプトの9.67%に現れる。
論文 参考訳(メタデータ) (2025-01-13T20:24:10Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Unveiling Hidden Links Between Unseen Security Entities [3.7138962865789353]
VulnScopperは、知識グラフ(KG)と自然言語処理(NLP)を組み合わせたマルチモーダル表現学習を利用した革新的なアプローチである。
我々は、National Vulnerability Database(NVD)とRed Hat CVEデータベースの2つの主要なセキュリティデータセットでVulnScopperを評価した。
VulnScopperは既存の手法よりも優れており、CVEをCWE(Common Vulnerabilities and Exposures)、CPE(Common Platform Languageions)にリンクする際の78%のHits@10精度を実現している。
論文 参考訳(メタデータ) (2024-03-04T13:14:39Z) - Patch2QL: Discover Cognate Defects in Open Source Software Supply Chain
With Auto-generated Static Analysis Rules [1.9591497166224197]
本稿では,SASTルールの自動生成によるOSSのコグネート欠陥の検出手法を提案する。
具体的には、プリパッチバージョンとポストパッチバージョンから重要な構文と意味情報を抽出する。
我々はPatch2QLというプロトタイプツールを実装し、それをC/C++の基本OSSに適用した。
論文 参考訳(メタデータ) (2024-01-23T02:23:11Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。
Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。
検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文 参考訳(メタデータ) (2023-06-08T20:14:46Z) - Upcycling Models under Domain and Category Shift [95.22147885947732]
グローバルかつ局所的なクラスタリング学習技術(GLC)を導入する。
我々は、異なる対象クラス間での区別を実現するために、新しい1-vs-allグローバルクラスタリングアルゴリズムを設計する。
注目すべきは、最も困難なオープンパーティルセットDAシナリオにおいて、GLCは、VisDAベンチマークでUMADを14.8%上回っていることである。
論文 参考訳(メタデータ) (2023-03-13T13:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。