Fugu-MT 論文翻訳(概要): Static Code Analyzer Recommendation via Preference Mining

論文の概要: Static Code Analyzer Recommendation via Preference Mining

arxiv url: http://arxiv.org/abs/2412.18393v1
Date: Tue, 24 Dec 2024 12:36:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-25 19:23:17.771991
Title: Static Code Analyzer Recommendation via Preference Mining
Title（参考訳）: 推奨マイニングによる静的コードアナライザ勧告
Authors: Xiuting Ge, Chunrong Fang, Xuanye Li, Ye Shang, Mengyao Zhang, Ya Pan,
Abstract要約: 静的コードアナライザ(SCA)は、ソフトウェアの品質保証において重要な役割を果たす。様々な静的解析技術を持つSCAは、偽陽性と偽陰性のレベルが異なる。あるプロジェクトにおけるより多くの欠陥を検出するために、このプロジェクトをスキャンするためにもっと利用可能なSCAを使用することが可能です。許容できないコストと過剰な警告を生成するため、あるプロジェクトのために利用可能なSCAを全て呼び出すことは、実際のシナリオでは現実的ではありません。
参考スコア（独自算出の注目度）: 5.933549388923786
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Static Code Analyzers (SCAs) have played a critical role in software quality assurance. However, SCAs with various static analysis techniques suffer from different levels of false positives and false negatives, thereby yielding the varying performance in SCAs. To detect more defects in a given project, it is a possible way to use more available SCAs for scanning this project. Due to producing unacceptable costs and overpowering warnings, invoking all available SCAs for a given project is impractical in real scenarios. To address the above problem, we are the first to propose a practical SCA recommendation approach via preference mining, which aims to select the most effective SCA for a given project. Specifically, our approach performs the SCA effectiveness evaluation to obtain the correspondingly optimal SCAs on projects under test. Subsequently, our approach performs the SCA preference mining via the project characteristics, thereby analyzing the intrinsic relation between projects under test and the correspondingly optimal SCAs. Finally, our approach constructs the SCA recommendation model based on the evaluation data and the associated analysis findings. We conduct the experimental evaluation on three popular SCAs as well as 213 open-source and large-scale projects. The results present that our constructed SCA recommendation model outperforms four typical baselines by 2 ~ 11 times.
Abstract（参考訳）: 静的コードアナライザ(SCA)は、ソフトウェアの品質保証において重要な役割を果たす。しかし、様々な静的解析技術を持つSCAは、異なるレベルの偽陽性と偽陰性に悩まされ、SCAにおける様々なパフォーマンスをもたらす。あるプロジェクトにおけるより多くの欠陥を検出するために、このプロジェクトをスキャンするためにもっと利用可能なSCAを使用することが可能です。許容できないコストと過剰な警告を生成するため、あるプロジェクトのために利用可能なSCAを全て呼び出すことは、実際のシナリオでは現実的ではありません。上記の問題に対処するため、私たちは、あるプロジェクトにおいて最も効果的なSCAを選択することを目的とした、優先順位マイニングによる実用的なSCAレコメンデーションアプローチを最初に提案します。具体的には、テスト中のプロジェクトにおいて、対応する最適なSCAを得るために、SCAの有効性評価を行う。提案手法は, プロジェクト特性によるSCA選好マイニングを行い, テスト中のプロジェクトとそれに対応する最適なSCAとの本質的な関係を解析する。最後に、評価データと関連する分析結果に基づいて、SCAレコメンデーションモデルを構築した。 3つのSCAおよび213のオープンソースおよび大規模プロジェクトで実験的な評価を行う。その結果、構築したSCAレコメンデーションモデルは4つの典型的なベースラインを2倍から11倍に上回っていることがわかった。

関連論文リスト

Probing Preference Representations: A Multi-Dimensional Evaluation and Analysis Method for Reward Models [63.00458229517523]
本研究は、嗜好表現を探索することで、報酬モデルの評価課題に対処する。多次元リワードモデルベンチマーク (MRMBench) を構築する。本稿では,報酬予測時に使用する次元を同定し,その解釈可能性を高める解析手法,推論時探索を提案する。
論文参考訳（メタデータ） (2025-11-16T05:29:29Z)
ARISE: An Adaptive Resolution-Aware Metric for Test-Time Scaling Evaluation in Large Reasoning Models [102.4511331368587]
ARISE(Adaptive Resolution-Aware Scaling Evaluation)は、大規模推論モデルの試験時間スケーリングの有効性を評価するために設計された新しい尺度である。我々は、様々な領域にわたる最先端の推論モデルを評価する包括的な実験を行う。
論文参考訳（メタデータ） (2025-10-07T15:10:51Z)
Supporting architecture evaluation for ATAM scenarios with LLMs [0.6136099525128398]
この研究は、ソフトウェアアーキテクチャコースの学生が提案する品質シナリオを分析するためのLLMツールとしてMS Copilotを研究している。最初の研究は、LLMが品質シナリオのリスク、感度ポイント、トレードオフ分析に関して、ほとんどのケースにおいて、より正確で正確な結果を生み出すことを明らかにした。
論文参考訳（メタデータ） (2025-05-30T18:42:12Z)
PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。これは、安全なデプロイメントを保証する上で、大きな課題となる。 PredictaBoardは,新しいベンチマークフレームワークである。
論文参考訳（メタデータ） (2025-02-20T10:52:38Z)
Learning to Plan & Reason for Evaluation with Thinking-LLM-as-a-Judge [78.28188747489769]
そこで我々は,Thinking-LLM-as-a-Judgeの優先最適化アルゴリズムであるEvalPlannerを提案する。自己学習ループでは、EvalPlannerは、合成的に構築された評価計画と実行よりも反復的に最適化する。提案手法はRewardBenchにおける生成報酬モデルのための新しい最先端性能を実現する。
論文参考訳（メタデータ） (2025-01-30T02:21:59Z)
Preserving Privacy in Software Composition Analysis: A Study of Technical Solutions and Enhancements [14.1152335184985]
ソフトウェアコンポジション分析(Software composition analysis、SCA)は、入力ソフトウェアアプリケーションにおいて、オープンソースソフトウェアコンポーネントを識別するプロセスを指す。 SCAはユーザがアプリケーションのソースコードをリモートのSCAサーバにアップロードする必要がある。プライバシーに関する懸念は、SCA技術が現実世界のシナリオで使用されるのを妨げています。
論文参考訳（メタデータ） (2024-12-01T17:17:29Z)
Semantic Component Analysis: Introducing Multi-Topic Distributions to Clustering-Based Topic Modeling [8.834228408033896]
本稿では,サンプル毎に複数のトピックを検出するトピックモデリング手法であるセマンティックコンポーネント分析(SCA)を紹介する。英語、ハウサ語、中国語のTwitterデータセット上でSCAを評価する。
論文参考訳（メタデータ） (2024-10-28T14:09:52Z)
Automated Off-Policy Estimator Selection via Supervised Learning [7.476028372444458]
オフ・ポリティ・アセスメント(OPE)問題(Off-Policy Evaluation)は、相手が収集したデータを用いて、対実的なポリシーの性能を評価することである。 OPEの問題を解決するために,我々は,ロギングポリシに代えて配置された場合の対策策が持つパフォーマンスを,最も正確な方法で推定することを目的とした推定器を利用する。教師付き学習に基づく自動データ駆動型OPE推定器選択法を提案する。
論文参考訳（メタデータ） (2024-06-26T02:34:48Z)
SORRY-Bench: Systematically Evaluating Large Language Model Safety Refusal Behaviors [64.9938658716425]
安全でないユーザリクエストを認識して拒否する、大規模な言語モデル(LLM)の既存の評価は、3つの制限に直面している。まず、既存の手法では、安全でないトピックの粗い粒度を使い、いくつかのきめ細かいトピックを過剰に表現している。第二に、プロンプトの言語的特徴とフォーマッティングは、様々な言語、方言など、多くの評価において暗黙的にのみ考慮されているように、しばしば見過ごされる。第3に、既存の評価は大きなLCMに頼っているため、コストがかかる可能性がある。
論文参考訳（メタデータ） (2024-06-20T17:56:07Z)
Exploring and Benchmarking the Planning Capabilities of Large Language Models [57.23454975238014]
この研究は、大規模言語モデル(LLM)の計画能力を改善するための基礎を築いた。我々は、古典的な計画ベンチマークと自然言語シナリオの両方を含む包括的なベンチマークスイートを構築した。本研究は,LLM計画の強化を目的としたマルチショットインコンテキスト学習について検討し,文脈長の増大と計画性能の向上の関係について検討する。
論文参考訳（メタデータ） (2024-06-18T22:57:06Z)
Tapping the Potential of Large Language Models as Recommender Systems: A Comprehensive Framework and Empirical Analysis [91.5632751731927]
ChatGPTのような大規模言語モデルは、一般的なタスクを解く際、顕著な能力を示した。本稿では,レコメンデーションタスクにおけるLLMの活用のための汎用フレームワークを提案し,レコメンデーションタスクとしてのLLMの機能に着目した。提案手法は,提案手法が推薦結果に与える影響を解析し,提案手法とモデルアーキテクチャ,パラメータスケール,コンテキスト長について検討する。
論文参考訳（メタデータ） (2024-01-10T08:28:56Z)
A Survey of Contextual Optimization Methods for Decision Making under Uncertainty [47.73071218563257]
この記事では、データからポリシーを学ぶための3つの主要なフレームワークを特定し、その強みと限界について論じる。統一的な表記と用語の下で既存のモデルとメソッドを示し、これらを3つの主要なフレームワークに従って分類する。
論文参考訳（メタデータ） (2023-06-17T15:21:02Z)
Design Amortization for Bayesian Optimal Experimental Design [70.13948372218849]
予測情報ゲイン(EIG)のバウンダリに関してパラメータ化された変分モデルを最適化する。実験者が1つの変分モデルを最適化し、潜在的に無限に多くの設計に対してEIGを推定できる新しいニューラルアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-10-07T02:12:34Z)
Active Surrogate Estimators: An Active Learning Approach to Label-Efficient Model Evaluation [59.7305309038676]
モデル評価のためのアクティブサロゲート推定器(ASE)を提案する。 ASEは現在の最先端技術よりもラベル効率が高いことが分かりました。
論文参考訳（メタデータ） (2022-02-14T17:15:18Z)
Optimal Decision Making in High-Throughput Virtual Screening Pipelines [12.366455276434513]
実験および/および計算評価を含むスクリーニングキャンペーンのほとんど(すべてではないとしても)に適用する2つの最適化フレームワークを提案する。特に、長い非コーディングRNA(lncRNA)分類のための最適な計算キャンペーンを実例として考察する。シミュレーションの結果,提案手法は候補候補に対する有効選択コストを大幅に削減することが示された。
論文参考訳（メタデータ） (2021-09-23T22:58:14Z)
A Proposed Framework for the Comprehensive Scalability Assessment of ICTD Projects [0.0]
ICTDプロジェクトのスケーラビリティは、この分野では無視されている必須のトピックである。本研究では,システム理論と増幅理論を用いたCSAF(Comprehensive Scalability Assessment Framework)を提案する。
論文参考訳（メタデータ） (2021-08-22T15:29:53Z)
SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文参考訳（メタデータ） (2020-06-12T10:40:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。