Fugu-MT 論文翻訳(概要): A Defect Taxonomy for Infrastructure as Code: A Replication Study

論文の概要: A Defect Taxonomy for Infrastructure as Code: A Replication Study

arxiv url: http://arxiv.org/abs/2505.01568v2
Date: Wed, 07 May 2025 12:04:34 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-08 12:54:13.626365
Title: A Defect Taxonomy for Infrastructure as Code: A Replication Study
Title（参考訳）: コードとしてのインフラストラクチャーの欠陥分類:重複研究
Authors: Filipe Paiva, João Brunet, Thiago Emmanuel Pereira, Wendell Oliveira,
Abstract要約: 以前の研究ではこのような分類法が開発されていたが、宣言的な言語であるPuppetのみに基づいていた。この分類法がPulumi、Terraform CDK、AWS CDKといったプログラミング言語ベースのIaCツールに適用されるかどうかは不明のままである。 PL-IaCレポジトリの3,364件の欠陥関連コミットについて定性解析を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Background: As Infrastructure as Code (IaC) becomes standard practice, ensuring the reliability of IaC scripts is essential. Defect taxonomies are valuable tools for this, offering a common language for issues and enabling systematic tracking. A significant prior study developed such a taxonomy, but based it exclusively on the declarative language Puppet. It remained unknown whether this taxonomy applies to programming language-based IaC (PL-IaC) tools like Pulumi, Terraform CDK, and AWS CDK. Aim: We replicated this foundational work to assess the generalizability of the taxonomy across a broader and more diverse landscape. Method: We performed qualitative analysis on 3,364 defect-related commits from 285 open-source PL-IaC repositories (PIPr dataset) to derive a PL-IaC-specific defect taxonomy. We then enhanced the ACID tool, originally developed for the prior study, to automatically classify and analyze defect distributions across an expanded dataset-447 open-source repositories and 94 proprietary projects from VTEX (e-commerce) and Nubank (financial). Results: Our research confirmed the same eight defect categories identified in the original study, with idempotency and security defects appearing infrequently but persistently across projects. Configuration Data defects maintain high frequency in both open-source and proprietary codebases. Conclusions: Our replication supports the generalizability of the original taxonomy, suggesting IaC development challenges surpass organizational boundaries. Configuration Data defects emerge as a persistent high-frequency problem, while idempotency and security defects remain important concerns despite lower frequency. These patterns appear consistent across open-source and proprietary projects, indicating they are fundamental to the IaC paradigm itself, transcending specific tools or project types.
Abstract（参考訳）: 背景: インフラストラクチャ・アズ・コード(IaC)が標準となるにつれて、IaCスクリプトの信頼性を保証することが不可欠です。欠陥分類(defect taxonomies)は、問題に対する共通言語を提供し、体系的な追跡を可能にする、このツールにとって貴重なツールである。重要な先行研究はそのような分類学を発展させたが、宣言的な言語であるPuppetのみに基づいていた。この分類法が、Pulumi、Terraform CDK、AWS CDKといったプログラミング言語ベースのIaC(PL-IaC)ツールに適用されるかどうかは不明のままである。 Aim: 私たちはこの基礎研究を再現し、より広い、より多様な景観における分類学の一般化可能性を評価しました。方法:285のPL-IaCレポジトリ(PIPrデータセット)から3,364件の欠陥関連コミットの質的分析を行い,PL-IaC固有の欠陥分類を導出した。次に我々は、元々この研究のために開発されたACIDツールを拡張し、拡張されたデータセット-447オープンソースリポジトリと、VTEX(eコマース)とNubank(金融)の94のプロプライエタリプロジェクト間で、欠陥分散を自動的に分類し分析した。結果:本研究で確認された8つの欠陥カテゴリは,イデオロシティとセキュリティの欠陥が稀に現れるが,プロジェクト全体にわたって持続的に現れることが確認された。構成データ欠陥は、オープンソースとプロプライエタリのコードベースの両方で高い頻度で維持される。結論:我々の複製は,本来の分類の一般化性を支持し,IaC開発課題が組織の境界を超えることを示唆している。構成データ欠陥は永続的な高周波問題として現れるが、イデオロシティとセキュリティの欠陥は、低い周波数にもかかわらず重要な関心事である。これらのパターンは、オープンソースおよびプロプライエタリなプロジェクト間で一貫性があり、IaCパラダイム自体の基本であり、特定のツールやプロジェクトタイプを超越していることを示している。

関連論文リスト

Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。複数の多様な実装設計を生成することで、線形パッチから切り離される。 NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳（メタデータ） (2026-03-02T12:50:40Z)
Bridging the Arithmetic Gap: The Cognitive Complexity Benchmark and Financial-PoT for Robust Financial Reasoning [11.522192050185568]
大規模言語モデルは,「認知的幻覚」と「認知的崩壊」というシステム的失敗モードに悩まされる実世界95の中国Aシェア年次レポートから構築したデータセットをベースとした,堅牢な評価フレームワークであるCognitive Complexity Benchmark(CCB)を紹介する。本稿では,これらの障害に対処するための反復的デュアル・パース・ファイナンシャル・PoTフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T01:33:33Z)
Characterizing Bugs and Quality Attributes in Quantum Software: A Large-Scale Empirical Study [0.6445605125467574]
本研究は,2012年から2024年までの123個のオープンソース量子レポジトリを対象とした,ソフトウェアバグのエコシステムスケールの経時的解析を行った。フルスタックのライブラリとコンパイラは、回路、ゲート、トランスパイレーションに関連する問題のために最もバグの多いカテゴリである。暗号、実験コンピューティング、コンパイラツールチェーンにおける高重度バグクラスタ。
論文参考訳（メタデータ） (2025-12-31T06:05:49Z)
Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning [65.20602712957725]
Cacoは、高品質で検証可能な多様な命令-CoT推論データの合成を自動化する新しいフレームワークである。我々の研究は、人間の介入なしに自己持続的で信頼できる推論システムを構築するためのパラダイムを確立します。
論文参考訳（メタデータ） (2025-10-05T07:59:24Z)
Adapting Vision-Language Models Without Labels: A Comprehensive Survey [74.17944178027015]
VLM(Vision-Language Models)は、幅広いタスクにまたがる顕著な一般化機能を示す。近年,ラベル付きデータに依存しない教師なし適応手法に注目が集まっている。本稿では,未ラベルの視覚データの可用性と性質に基づく分類法を提案し,既存のアプローチを4つの重要なパラダイムに分類する。
論文参考訳（メタデータ） (2025-08-07T16:27:37Z)
Refactoring $\ eq$ Bug-Inducing: Improving Defect Prediction with Code Change Tactics Analysis [54.361900378970134]
Just-in-time defect prediction (JIT-DP) は、早期にソフトウェア欠陥を引き起こすコード変更の可能性を予測することを目的としている。これまでの研究は、その頻度にもかかわらず、評価フェーズと方法論フェーズの両方でコードを無視してきた。 JIT-Defects4Jデータセットのラベリング精度を13.7%向上させるコードと伝播を分類するためのCode chAnge Tactics (CAT)解析を提案する。
論文参考訳（メタデータ） (2025-07-25T23:29:25Z)
FORGE: An LLM-driven Framework for Large-Scale Smart Contract Vulnerability Dataset Construction [34.20628333535654]
FORGEはスマートコントラクト脆弱性データセットを構築するための最初の自動化アプローチである。 81,390のソリッドリティファイルと27,497の脆弱性を296のCWEカテゴリに分類したデータセットを生成した。その結果、現在の検出能力の重大な制限が明らかになった。
論文参考訳（メタデータ） (2025-06-23T16:03:16Z)
Boosting Vulnerability Detection of LLMs via Curriculum Preference Optimization with Synthetic Reasoning Data [22.557961978833386]
本稿では,脆弱性パターンのマイニングに優れた大規模言語モデル(LLM)の新たなフレームワークを提案する。具体的には、脆弱性と対応する固定コードに対する前方および後方の推論プロセスを構築し、高品質な推論データの合成を保証する。 ReVD は LLM ベースのソフトウェア脆弱性検出のための新たな最先端技術,例えば 12.24%-22.77% の精度向上を実現している。
論文参考訳（メタデータ） (2025-06-09T03:25:23Z)
Smells-sus: Sustainability Smells in IaC [0.0]
この研究は、広く採用されているInfrastructure as Code(IaC)ツールであるTerraformに焦点を当てている。持続可能性嗅覚を7つ定義し,19人のIaC実践者を対象に調査を行った。最も一般的な臭いはモノリシックインフラストラクチャであり、スクリプトの9.67%に現れる。
論文参考訳（メタデータ） (2025-01-13T20:24:10Z)
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [73.34893326181046]
本稿では,効率的なモデル適応によりRAGシステムを強化する自己教師型フレームワークKBAlignを提案する。私たちのキーとなる洞察は、2つの革新的なメカニズムを通じて、モデルの本質的な能力を知識の整合性に活用することです。 KBAlign は GPT-4 による適応によって得られる性能向上の90%を達成できることを示した。
論文参考訳（メタデータ） (2024-11-22T08:21:03Z)
Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文参考訳（メタデータ） (2024-06-05T20:19:09Z)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。 GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳（メタデータ） (2024-06-01T08:01:05Z)
Unveiling Hidden Links Between Unseen Security Entities [3.7138962865789353]
VulnScopperは、知識グラフ(KG)と自然言語処理(NLP)を組み合わせたマルチモーダル表現学習を利用した革新的なアプローチである。我々は、National Vulnerability Database(NVD)とRed Hat CVEデータベースの2つの主要なセキュリティデータセットでVulnScopperを評価した。 VulnScopperは既存の手法よりも優れており、CVEをCWE(Common Vulnerabilities and Exposures)、CPE(Common Platform Languageions)にリンクする際の78%のHits@10精度を実現している。
論文参考訳（メタデータ） (2024-03-04T13:14:39Z)
Patch2QL: Discover Cognate Defects in Open Source Software Supply Chain With Auto-generated Static Analysis Rules [1.9591497166224197]
本稿では,SASTルールの自動生成によるOSSのコグネート欠陥の検出手法を提案する。具体的には、プリパッチバージョンとポストパッチバージョンから重要な構文と意味情報を抽出する。我々はPatch2QLというプロトタイプツールを実装し、それをC/C++の基本OSSに適用した。
論文参考訳（メタデータ） (2024-01-23T02:23:11Z)
Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文参考訳（メタデータ） (2023-06-20T14:21:58Z)
On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。 Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文参考訳（メタデータ） (2023-06-08T20:14:46Z)
Upcycling Models under Domain and Category Shift [95.22147885947732]
グローバルかつ局所的なクラスタリング学習技術(GLC)を導入する。我々は、異なる対象クラス間での区別を実現するために、新しい1-vs-allグローバルクラスタリングアルゴリズムを設計する。注目すべきは、最も困難なオープンパーティルセットDAシナリオにおいて、GLCは、VisDAベンチマークでUMADを14.8%上回っていることである。
論文参考訳（メタデータ） (2023-03-13T13:44:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。