論文の概要: Example-based Synthesis of Static Analysis Rules
- arxiv url: http://arxiv.org/abs/2204.08643v1
- Date: Tue, 19 Apr 2022 03:56:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 14:42:25.294220
- Title: Example-based Synthesis of Static Analysis Rules
- Title(参考訳): 静的解析規則の例に基づく合成
- Authors: Pranav Garg and Srinivasan Sengamedu SHS
- Abstract要約: 静的解析ツールはいくつかのコード品質の問題に対してルールを持ち、これらのルールは専門家が手動で作成する。
規則合成問題を,符号のグラフ表現上の一階述語論理式として定式化する。
線形計画法に基づくグラフアライメントに基づく新しい合成アルゴリズムRho Synthを提案する。
- 参考スコア(独自算出の注目度): 1.52292571922932
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Static Analysis tools have rules for several code quality issues and these
rules are created by experts manually. In this paper, we address the problem of
automatic synthesis of code quality rules from examples. We formulate the rule
synthesis problem as synthesizing first order logic formulas over graph
representations of code. We present a new synthesis algorithm RhoSynth that is
based on Integer Linear Programming-based graph alignment for identifying code
elements of interest to the rule. We bootstrap RhoSynth by leveraging code
changes made by developers as the source of positive and negative examples. We
also address rule refinement in which the rules are incrementally improved with
additional user-provided examples. We validate RhoSynth by synthesizing more
than 30 Java code quality rules. These rules have been deployed as part of a
code review system in a company and their precision exceeds 75% based on
developer feedback collected during live code-reviews. Through comparisons with
recent baselines, we show that current state-of-the-art program synthesis
approaches are unable to synthesize most of these rules.
- Abstract(参考訳): 静的解析ツールはいくつかのコード品質の問題に対してルールを持ち、これらのルールは専門家が手動で作成する。
本稿では,サンプルからコード品質ルールを自動合成する問題に対処する。
ルール合成問題を,コードのグラフ表現上の一階述語論理式を合成するものとして定式化する。
本稿では,整数線形計画に基づくグラフアライメントに基づく新しい合成アルゴリズムrhosynthを提案する。
rhosynthをブートストラップして、開発者のコード変更をポジティブな例とネガティブな例のソースとして活用します。
また、ルールを段階的に改善するルール改善についても、ユーザが提供する追加例で対処する。
RhoSynthは30以上のJavaコード品質ルールを合成することで検証します。
これらのルールは、企業のコードレビューシステムの一部としてデプロイされ、その精度は、ライブコードレビュー中に収集された開発者フィードバックに基づいて75%を超えている。
近年のベースラインとの比較により,現状のプログラム合成手法ではこれらの規則のほとんどを合成できないことを示す。
関連論文リスト
- Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.13471417703669]
大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。
我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。
編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文 参考訳(メタデータ) (2024-10-03T17:57:22Z) - Amortizing Pragmatic Program Synthesis with Rankings [17.775664476910247]
合理的音声法(RSA)フレームワークの使用は、プログラムシンセサイザーの構築に成功している。
遅くて正確なRSAシンセサイザーを再生する一般的な方法を提案する。
論文 参考訳(メタデータ) (2024-06-01T22:55:33Z) - Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.48355455324688]
そこで本研究では,コードと書き直された変種との類似性に基づいて,ゼロショット合成符号検出器を提案する。
以上の結果から,既存のテキスト用合成コンテンツ検出装置よりも顕著な向上が見られた。
論文 参考訳(メタデータ) (2024-05-25T08:57:28Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z) - Guiding Enumerative Program Synthesis with Large Language Models [15.500250058226474]
本稿では,形式的合成ベンチマークを解くための大規模言語モデルの能力を評価する。
ワンショット合成が失敗すると,新しい列挙合成アルゴリズムを提案する。
形式的合成のためのスタンドアロンツールとしてGPT-3.5は,最先端の形式的合成アルゴリズムにより容易に性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-03-06T19:13:53Z) - ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。
本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文 参考訳(メタデータ) (2023-07-26T01:07:52Z) - Outline, Then Details: Syntactically Guided Coarse-To-Fine Code
Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。
自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文 参考訳(メタデータ) (2023-04-28T01:47:09Z) - Soft-Labeled Contrastive Pre-training for Function-level Code
Representation [127.71430696347174]
textbfSoft-labeled contrastive pre-training framework with two positive sample construction method。
大規模コードコーパスにおけるコード間の関連性を考慮すると、ソフトラベル付きコントラスト付き事前学習は、きめ細かいソフトラベルを得ることができる。
SCodeRは、7つのデータセットで4つのコード関連タスクに対して、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T05:17:37Z) - InCoder: A Generative Model for Code Infilling and Synthesis [88.46061996766348]
InCoderは、プログラム合成(左から右への生成)と編集(埋め込み)が可能な統合生成モデルである。
InCoderは、許可されたコードの大きなコーパスからコードファイルを生成するように訓練されている。
私たちのモデルは、ゼロショットコードの埋め込みを直接実行できる最初の生成モデルです。
論文 参考訳(メタデータ) (2022-04-12T16:25:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。