論文の概要: Static Code Analyzer Recommendation via Preference Mining
- arxiv url: http://arxiv.org/abs/2412.18393v1
- Date: Tue, 24 Dec 2024 12:36:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:56:08.447411
- Title: Static Code Analyzer Recommendation via Preference Mining
- Title(参考訳): 推奨マイニングによる静的コードアナライザ勧告
- Authors: Xiuting Ge, Chunrong Fang, Xuanye Li, Ye Shang, Mengyao Zhang, Ya Pan,
- Abstract要約: 静的コードアナライザ(SCA)は、ソフトウェアの品質保証において重要な役割を果たす。
様々な静的解析技術を持つSCAは、偽陽性と偽陰性のレベルが異なる。
あるプロジェクトにおけるより多くの欠陥を検出するために、このプロジェクトをスキャンするためにもっと利用可能なSCAを使用することが可能です。
許容できないコストと過剰な警告を生成するため、あるプロジェクトのために利用可能なSCAを全て呼び出すことは、実際のシナリオでは現実的ではありません。
- 参考スコア(独自算出の注目度): 5.933549388923786
- License:
- Abstract: Static Code Analyzers (SCAs) have played a critical role in software quality assurance. However, SCAs with various static analysis techniques suffer from different levels of false positives and false negatives, thereby yielding the varying performance in SCAs. To detect more defects in a given project, it is a possible way to use more available SCAs for scanning this project. Due to producing unacceptable costs and overpowering warnings, invoking all available SCAs for a given project is impractical in real scenarios. To address the above problem, we are the first to propose a practical SCA recommendation approach via preference mining, which aims to select the most effective SCA for a given project. Specifically, our approach performs the SCA effectiveness evaluation to obtain the correspondingly optimal SCAs on projects under test. Subsequently, our approach performs the SCA preference mining via the project characteristics, thereby analyzing the intrinsic relation between projects under test and the correspondingly optimal SCAs. Finally, our approach constructs the SCA recommendation model based on the evaluation data and the associated analysis findings. We conduct the experimental evaluation on three popular SCAs as well as 213 open-source and large-scale projects. The results present that our constructed SCA recommendation model outperforms four typical baselines by 2 ~ 11 times.
- Abstract(参考訳): 静的コードアナライザ(SCA)は、ソフトウェアの品質保証において重要な役割を果たす。
しかし、様々な静的解析技術を持つSCAは、異なるレベルの偽陽性と偽陰性に悩まされ、SCAにおける様々なパフォーマンスをもたらす。
あるプロジェクトにおけるより多くの欠陥を検出するために、このプロジェクトをスキャンするためにもっと利用可能なSCAを使用することが可能です。
許容できないコストと過剰な警告を生成するため、あるプロジェクトのために利用可能なSCAを全て呼び出すことは、実際のシナリオでは現実的ではありません。
上記の問題に対処するため、私たちは、あるプロジェクトにおいて最も効果的なSCAを選択することを目的とした、優先順位マイニングによる実用的なSCAレコメンデーションアプローチを最初に提案します。
具体的には、テスト中のプロジェクトにおいて、対応する最適なSCAを得るために、SCAの有効性評価を行う。
提案手法は, プロジェクト特性によるSCA選好マイニングを行い, テスト中のプロジェクトとそれに対応する最適なSCAとの本質的な関係を解析する。
最後に、評価データと関連する分析結果に基づいて、SCAレコメンデーションモデルを構築した。
3つのSCAおよび213のオープンソースおよび大規模プロジェクトで実験的な評価を行う。
その結果、構築したSCAレコメンデーションモデルは4つの典型的なベースラインを2倍から11倍に上回っていることがわかった。
関連論文リスト
- PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。
これは、安全なデプロイメントを保証する上で、大きな課題となる。
PredictaBoardは,新しいベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-02-20T10:52:38Z) - Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge [78.28188747489769]
そこで我々は,Thinking-LLM-as-a-Judgeの優先最適化アルゴリズムであるEvalPlannerを提案する。
自己学習ループでは、EvalPlannerは、合成的に構築された評価計画と実行よりも反復的に最適化する。
提案手法はRewardBenchにおける生成報酬モデルのための新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2025-01-30T02:21:59Z) - Preserving Privacy in Software Composition Analysis: A Study of Technical Solutions and Enhancements [14.1152335184985]
ソフトウェアコンポジション分析(Software composition analysis、SCA)は、入力ソフトウェアアプリケーションにおいて、オープンソースソフトウェアコンポーネントを識別するプロセスを指す。
SCAはユーザがアプリケーションのソースコードをリモートのSCAサーバにアップロードする必要がある。
プライバシーに関する懸念は、SCA技術が現実世界のシナリオで使用されるのを妨げています。
論文 参考訳(メタデータ) (2024-12-01T17:17:29Z) - Automated Off-Policy Estimator Selection via Supervised Learning [7.476028372444458]
オフ・ポリティ・アセスメント(OPE)問題(Off-Policy Evaluation)は、相手が収集したデータを用いて、対実的なポリシーの性能を評価することである。
OPEの問題を解決するために,我々は,ロギングポリシに代えて配置された場合の対策策が持つパフォーマンスを,最も正確な方法で推定することを目的とした推定器を利用する。
教師付き学習に基づく自動データ駆動型OPE推定器選択法を提案する。
論文 参考訳(メタデータ) (2024-06-26T02:34:48Z) - SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal Behaviors [64.9938658716425]
安全でないユーザリクエストを認識して拒否する、大規模な言語モデル(LLM)の既存の評価は、3つの制限に直面している。
まず、既存の手法では、安全でないトピックの粗い粒度を使い、いくつかのきめ細かいトピックを過剰に表現している。
第二に、プロンプトの言語的特徴とフォーマッティングは、様々な言語、方言など、多くの評価において暗黙的にのみ考慮されているように、しばしば見過ごされる。
第3に、既存の評価は大きなLCMに頼っているため、コストがかかる可能性がある。
論文 参考訳(メタデータ) (2024-06-20T17:56:07Z) - Tapping the Potential of Large Language Models as Recommender Systems: A Comprehensive Framework and Empirical Analysis [91.5632751731927]
ChatGPTのような大規模言語モデルは、一般的なタスクを解く際、顕著な能力を示した。
本稿では,レコメンデーションタスクにおけるLLMの活用のための汎用フレームワークを提案し,レコメンデーションタスクとしてのLLMの機能に着目した。
提案手法は,提案手法が推薦結果に与える影響を解析し,提案手法とモデルアーキテクチャ,パラメータスケール,コンテキスト長について検討する。
論文 参考訳(メタデータ) (2024-01-10T08:28:56Z) - Active Surrogate Estimators: An Active Learning Approach to
Label-Efficient Model Evaluation [59.7305309038676]
モデル評価のためのアクティブサロゲート推定器(ASE)を提案する。
ASEは現在の最先端技術よりもラベル効率が高いことが分かりました。
論文 参考訳(メタデータ) (2022-02-14T17:15:18Z) - Optimal Decision Making in High-Throughput Virtual Screening Pipelines [12.366455276434513]
実験および/および計算評価を含むスクリーニングキャンペーンのほとんど(すべてではないとしても)に適用する2つの最適化フレームワークを提案する。
特に、長い非コーディングRNA(lncRNA)分類のための最適な計算キャンペーンを実例として考察する。
シミュレーションの結果,提案手法は候補候補に対する有効選択コストを大幅に削減することが示された。
論文 参考訳(メタデータ) (2021-09-23T22:58:14Z) - A Proposed Framework for the Comprehensive Scalability Assessment of
ICTD Projects [0.0]
ICTDプロジェクトのスケーラビリティは、この分野では無視されている必須のトピックである。
本研究では,システム理論と増幅理論を用いたCSAF(Comprehensive Scalability Assessment Framework)を提案する。
論文 参考訳(メタデータ) (2021-08-22T15:29:53Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。