論文の概要: A Static Analysis of Popular C Packages in Linux
- arxiv url: http://arxiv.org/abs/2409.18530v1
- Date: Fri, 27 Sep 2024 08:11:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 05:42:34.438525
- Title: A Static Analysis of Popular C Packages in Linux
- Title(参考訳): Linux における C パッケージの静的解析
- Authors: Jukka Ruohonen, Mubashrah Saddiqa, Krzysztof Sierszecki,
- Abstract要約: 本稿では,GCCのアナライザを用いて,人気のあるLinuxパッケージを実証的に検証する。
データセットは、Cで書かれたかCコードを含むGentoo Linuxディストリビューションのパッケージに基づいている。
- 参考スコア(独自算出の注目度): 0.19116784879310028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Static analysis is a classical technique for improving software security and software quality in general. Fairly recently, a new static analyzer was implemented in the GNU Compiler Collection (GCC). The present paper uses the GCC's analyzer to empirically examine popular Linux packages. The dataset used is based on those packages in the Gentoo Linux distribution that are either written in C or contain C code. In total, $3,538$ such packages are covered. According to the results, uninitialized variables and NULL pointer dereference issues are the most common problems according to the analyzer. Classical memory management issues are relatively rare. The warnings also follow a long-tailed probability distribution across the packages; a few packages are highly warning-prone, whereas no warnings are present for as much as 89% of the packages. Furthermore, the warnings do not vary across different application domains. With these results, the paper contributes to the domain of large-scale empirical research on software quality and security. In addition, a discussion is presented about practical implications of the results.
- Abstract(参考訳): 静的解析は、ソフトウェアセキュリティとソフトウェア品質全般を改善するための古典的なテクニックである。
最近では、GNUコンパイラコレクション(GCC)に新しい静的アナライザが実装されている。
本稿では,GCCのアナライザを用いて,人気のあるLinuxパッケージを実証的に検証する。
使用されるデータセットは、Cで書かれたかCコードを含むGentoo Linuxディストリビューションのパッケージに基づいている。
合計3538ドルのパッケージがカバーされている。
結果によると、初期化されていない変数とNULLポインタの参照遅延問題は、アナライザによると最も一般的な問題である。
古典的なメモリ管理の問題は比較的稀である。
警告は、パッケージ全体の長い尾の確率分布も追従する。いくつかのパッケージは、非常に警告がやすいが、パッケージの最大89%の警告は存在しない。
さらに、警告はアプリケーションドメインによって異なるわけではない。
これらの結果から,ソフトウェアの品質とセキュリティに関する大規模実証研究の領域に寄与する。
また、結果の実際的な影響についても論じる。
関連論文リスト
- Scaling Symbolic Execution to Large Software Systems [0.0]
シンボル実行は、プログラム検証とバグ検出ソフトウェアの両方で使用される一般的な静的解析手法である。
我々は、Clang Static Analyzerと呼ばれるエラー検出フレームワークと、その周辺に構築されたインフラストラクチャーであるCodeCheckerに焦点を当てた。
論文 参考訳(メタデータ) (2024-08-04T02:54:58Z) - OCTrack: Benchmarking the Open-Corpus Multi-Object Tracking [63.53176412315835]
オープンコーパス多対象追跡(OCMOT)の新たな実用的課題について検討する。
我々は,OCMOT問題に対する標準評価プラットフォームを提供するために,大規模かつ包括的なベンチマークであるOCTrackBを構築した。
論文 参考訳(メタデータ) (2024-07-19T05:58:01Z) - KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.20933707301566]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文 参考訳(メタデータ) (2024-07-02T21:44:22Z) - DONAPI: Malicious NPM Packages Detector using Behavior Sequence Knowledge Mapping [28.852274185512236]
npmは最も広範なパッケージマネージャであり、200万人以上のサードパーティのオープンソースパッケージをホストしている。
本稿では,340万以上のパッケージを含むローカルパッケージキャッシュをほぼリアルタイムで同期させ,より詳細なパッケージコードにアクセスできるようにする。
静的解析と動的解析を組み合わせた自動悪質npmパッケージ検出器であるDONAPIを提案する。
論文 参考訳(メタデータ) (2024-03-13T08:38:21Z) - An Investigation of Patch Porting Practices of the Linux Kernel
Ecosystem [39.80455045213432]
Linuxエコシステムにおけるパッチポーティングの応答性について検討する。
この現象を説明するのに役立つパッチポーティング戦略と能力レベルが多様である。
一般的なパッチフローの分析に基づいて推奨する。
論文 参考訳(メタデータ) (2024-02-07T19:38:48Z) - Symbol-Specific Sparsification of Interprocedural Distributive
Environment Problems [3.9777369380822956]
本稿では,言語間分散環境(IDE)フレームワークに適合する静的解析のスパース化を実現するフレームワークであるSparse IDEを提案する。
SparseHeros上に線形定数伝搬解析クライアントを設計,実装,評価する。
論文 参考訳(メタデータ) (2024-01-26T12:31:30Z) - DADApy: Distance-based Analysis of DAta-manifolds in Python [51.37841707191944]
DADApyは、高次元データの分析と特徴付けのためのピソンソフトウェアパッケージである。
固有次元と確率密度を推定し、密度に基づくクラスタリングを行い、異なる距離メトリクスを比較する方法を提供する。
論文 参考訳(メタデータ) (2022-05-04T08:41:59Z) - Scikit-dimension: a Python package for intrinsic dimension estimation [58.8599521537]
この技術ノートは、固有次元推定のためのオープンソースのPythonパッケージであるtextttscikit-dimensionを紹介している。
textttscikit-dimensionパッケージは、Scikit-learnアプリケーションプログラミングインターフェイスに基づいて、既知のID推定子のほとんどを均一に実装する。
パッケージを簡潔に記述し、実生活と合成データにおけるID推定手法の大規模(500以上のデータセット)ベンチマークでその使用を実証する。
論文 参考訳(メタデータ) (2021-09-06T16:46:38Z) - A general sample complexity analysis of vanilla policy gradient [101.16957584135767]
政策勾配(PG)は、最も一般的な強化学習(RL)問題の1つである。
PG軌道の「バニラ」理論的理解は、RL問題を解く最も一般的な方法の1つである。
論文 参考訳(メタデータ) (2021-07-23T19:38:17Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z) - Configuring Test Generators using Bug Reports: A Case Study of GCC
Compiler and Csmith [2.1016374925364616]
本稿では,バグレポートのコードスニペットを使用して,テスト生成のガイドを行う。
GCCの8つのバージョンでこのアプローチを評価します。
我々は,本手法がGCCの最先端テスト生成技術よりも高いカバレッジを提供し,誤コンパイル障害を引き起こすことを発見した。
論文 参考訳(メタデータ) (2020-12-19T11:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。