Fugu-MT 論文翻訳(概要): Example-based Synthesis of Static Analysis Rules

論文の概要: Example-based Synthesis of Static Analysis Rules

arxiv url: http://arxiv.org/abs/2204.08643v1
Date: Tue, 19 Apr 2022 03:56:20 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-20 14:42:25.294220
Title: Example-based Synthesis of Static Analysis Rules
Title（参考訳）: 静的解析規則の例に基づく合成
Authors: Pranav Garg and Srinivasan Sengamedu SHS
Abstract要約: 静的解析ツールはいくつかのコード品質の問題に対してルールを持ち、これらのルールは専門家が手動で作成する。規則合成問題を,符号のグラフ表現上の一階述語論理式として定式化する。線形計画法に基づくグラフアライメントに基づく新しい合成アルゴリズムRho Synthを提案する。
参考スコア（独自算出の注目度）: 1.52292571922932
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Static Analysis tools have rules for several code quality issues and these rules are created by experts manually. In this paper, we address the problem of automatic synthesis of code quality rules from examples. We formulate the rule synthesis problem as synthesizing first order logic formulas over graph representations of code. We present a new synthesis algorithm RhoSynth that is based on Integer Linear Programming-based graph alignment for identifying code elements of interest to the rule. We bootstrap RhoSynth by leveraging code changes made by developers as the source of positive and negative examples. We also address rule refinement in which the rules are incrementally improved with additional user-provided examples. We validate RhoSynth by synthesizing more than 30 Java code quality rules. These rules have been deployed as part of a code review system in a company and their precision exceeds 75% based on developer feedback collected during live code-reviews. Through comparisons with recent baselines, we show that current state-of-the-art program synthesis approaches are unable to synthesize most of these rules.
Abstract（参考訳）: 静的解析ツールはいくつかのコード品質の問題に対してルールを持ち、これらのルールは専門家が手動で作成する。本稿では,サンプルからコード品質ルールを自動合成する問題に対処する。ルール合成問題を,コードのグラフ表現上の一階述語論理式を合成するものとして定式化する。本稿では,整数線形計画に基づくグラフアライメントに基づく新しい合成アルゴリズムrhosynthを提案する。 rhosynthをブートストラップして、開発者のコード変更をポジティブな例とネガティブな例のソースとして活用します。また、ルールを段階的に改善するルール改善についても、ユーザが提供する追加例で対処する。 RhoSynthは30以上のJavaコード品質ルールを合成することで検証します。これらのルールは、企業のコードレビューシステムの一部としてデプロイされ、その精度は、ライブコードレビュー中に収集された開発者フィードバックに基づいて75%を超えている。近年のベースラインとの比較により,現状のプログラム合成手法ではこれらの規則のほとんどを合成できないことを示す。

関連論文リスト

InfoSynth: Information-Guided Benchmark Synthesis for LLMs [69.80981631587501]
大規模言語モデル (LLM) は推論やコード生成において大きな進歩を見せている。従来のベンチマーク作成は人手による作業に依存しています。この作業では、推論ベンチマークの自動生成と評価のための新しいフレームワークであるInfo Synthを紹介した。
論文参考訳（メタデータ） (2026-01-02T05:26:27Z)
Uncovering Pretraining Code in LLMs: A Syntax-Aware Attribution Approach [20.775027150345107]
オープンソースコードは、しばしばオープンソースライセンスによって保護されるが、事前トレーニングで使用する場合、法的および倫理的な課題を提起する。コードに適した構文決定型メンバシップ推論攻撃法であるSynPruneを提案する。
論文参考訳（メタデータ） (2025-11-10T12:29:09Z)
CodeEvo: Interaction-Driven Synthesis of Code-centric Data through Hybrid and Iterative Feedback [21.627909324788597]
大規模言語モデルの訓練には高品質な命令コードペアの獲得が不可欠である。 2つのLLMエージェント間の反復的な相互作用を通じてコードデータを合成するフレームワークであるCodeEvoを提案する。
論文参考訳（メタデータ） (2025-07-25T16:12:51Z)
Infinite-Instruct: Synthesizing Scaling Code instruction Data with Bidirectional Synthesis and Static Verification [9.332807762710127]
Infinite-Instructは高品質な質問応答ペアのための自動フレームワークである。このフレームワークは、合成問題の内部ロジックの改善に焦点を当てている。言語間の静的コード解析パイプラインは、データ品質を保証するために無効なサンプルをフィルタする。
論文参考訳（メタデータ） (2025-05-29T07:14:43Z)
Training Language Models on Synthetic Edit Sequences Improves Code Synthesis [33.13471417703669]
大規模言語モデル(LLM)は、プログラムを単一のパスで自動ソースで合成する。我々はLintSeqと呼ばれる合成データ生成アルゴリズムを開発し、高品質なコード編集データを生成する。編集シーケンスを微調整したモデルがベースライン合成よりも多様なプログラムを生成することを示す。
論文参考訳（メタデータ） (2024-10-03T17:57:22Z)
Amortizing Pragmatic Program Synthesis with Rankings [17.775664476910247]
合理的音声法(RSA)フレームワークの使用は、プログラムシンセサイザーの構築に成功している。遅くて正確なRSAシンセサイザーを再生する一般的な方法を提案する。
論文参考訳（メタデータ） (2024-06-01T22:55:33Z)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.48355455324688]
そこで本研究では,コードと書き直された変種との類似性に基づいて,ゼロショット合成符号検出器を提案する。以上の結果から,既存のテキスト用合成コンテンツ検出装置よりも顕著な向上が見られた。
論文参考訳（メタデータ） (2024-05-25T08:57:28Z)
SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文参考訳（メタデータ） (2024-05-16T12:22:41Z)
Guiding Enumerative Program Synthesis with Large Language Models [15.500250058226474]
本稿では,形式的合成ベンチマークを解くための大規模言語モデルの能力を評価する。ワンショット合成が失敗すると,新しい列挙合成アルゴリズムを提案する。形式的合成のためのスタンドアロンツールとしてGPT-3.5は,最先端の形式的合成アルゴリズムにより容易に性能が向上することがわかった。
論文参考訳（メタデータ） (2024-03-06T19:13:53Z)
ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文参考訳（メタデータ） (2023-07-26T01:07:52Z)
Outline, Then Details: Syntactically Guided Coarse-To-Fine Code Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文参考訳（メタデータ） (2023-04-28T01:47:09Z)
Soft-Labeled Contrastive Pre-training for Function-level Code Representation [127.71430696347174]
textbfSoft-labeled contrastive pre-training framework with two positive sample construction method。大規模コードコーパスにおけるコード間の関連性を考慮すると、ソフトラベル付きコントラスト付き事前学習は、きめ細かいソフトラベルを得ることができる。 SCodeRは、7つのデータセットで4つのコード関連タスクに対して、最先端のパフォーマンスを新たに達成する。
論文参考訳（メタデータ） (2022-10-18T05:17:37Z)
InCoder: A Generative Model for Code Infilling and Synthesis [88.46061996766348]
InCoderは、プログラム合成(左から右への生成)と編集(埋め込み)が可能な統合生成モデルである。 InCoderは、許可されたコードの大きなコーパスからコードファイルを生成するように訓練されている。私たちのモデルは、ゼロショットコードの埋め込みを直接実行できる最初の生成モデルです。
論文参考訳（メタデータ） (2022-04-12T16:25:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。