論文の概要: Still Manual? Automated Linter Configuration via DSL-Based LLM Compilation of Coding Standards
- arxiv url: http://arxiv.org/abs/2602.07783v1
- Date: Sun, 08 Feb 2026 02:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.797735
- Title: Still Manual? Automated Linter Configuration via DSL-Based LLM Compilation of Coding Standards
- Title(参考訳): まだ手動?DSLによるコーディング標準のLLMコンパイルによる自動Linter設定
- Authors: Zejun Zhang, Yixin Gan, Zhenchang Xing, Tian Zhang, Yi Li, Xiwei Xu, Qinghua Lu, Liming Zhu,
- Abstract要約: LintCFGはドメイン固有言語(LLM)によるコンパイルアプローチで、linter設定生成を自動化する。
コンパイラ設計に触発されて、私たちはまず、ツールに依存しない、構造化され、読みやすく、正確な方法でコーディングルールを表現するDSLを設計します。
特定の自然言語コーディング標準に対して、コンパイルプロセスはそれをDSLコーディング標準に解析し、DSL設定命令とマッチングし、最終的にlinter固有の構成を生成する。
- 参考スコア(独自算出の注目度): 25.340167690362804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coding standards are essential for maintaining consistent and high-quality code across teams and projects. Linters help developers enforce these standards by detecting code violations. However, manual linter configuration is complex and expertise-intensive, and the diversity and evolution of programming languages, coding standards, and linters lead to repetitive and maintenance-intensive configuration work. To reduce manual effort, we propose LintCFG, a domain-specific language (DSL)-driven, LLM-based compilation approach to automate linter configuration generation for coding standards, independent of programming languages, coding standards, and linters. Inspired by compiler design, we first design a DSL to express coding rules in a tool-agnostic, structured, readable, and precise manner. Then, we build linter configurations into DSL configuration instructions. For a given natural language coding standard, the compilation process parses it into DSL coding standards, matches them with the DSL configuration instructions to set configuration names, option names and values, verifies consistency between the standards and configurations, and finally generates linter-specific configurations. Experiments with Checkstyle for Java coding standard show that our approach achieves over 90% precision and recall in DSL representation, with accuracy, precision, recall, and F1-scores close to 70% (with some exceeding 70%) in fine-grained linter configuration generation. Notably, our approach outperforms baselines by over 100% in precision. A user study further shows that our approach improves developers' efficiency in configuring linters for coding standards. Finally, we demonstrate the generality of the approach by generating ESLint configurations for JavaScript coding standards, showcasing its broad applicability across other programming languages, coding standards, and linters.
- Abstract(参考訳): コーディング標準は、チームやプロジェクト間で一貫性のある高品質なコードを維持するために不可欠です。
リンタは、コード違反を検出することによって、開発者がこれらの標準を強制するのに役立つ。
しかし、手動のlinter設定は複雑で専門性に重点を置いており、プログラミング言語、コーディング標準、リンタの多様性と進化により、反復的かつメンテナンス集約的な構成作業がもたらされる。
手作業の労力を減らすために,LintCFGを提案する。LintCFGはドメイン固有言語(DSL)駆動のLLMベースのコンパイル手法で,コーディング標準のためのlinter設定生成を自動化する。
コンパイラ設計に触発されて、私たちはまず、ツールに依存しない、構造化され、読みやすく、正確な方法でコーディングルールを表現するDSLを設計します。
次に、DSL設定命令にlinter設定を組み込む。
特定の自然言語コーディング標準に対して、コンパイルプロセスはDSLコーディング標準を解析し、DSL設定命令と照合して構成名、オプション名、値を設定し、標準と設定間の一貫性を確認し、最終的にlinter固有の構成を生成する。
Checkstyle for Javaのコーディング標準を用いた実験では、精度、精度、リコール、F1スコアを70%近く(一部は70%以上)微細なlinter設定生成で達成している。
特に,本手法は,ベースラインの精度を100%以上向上させる。
さらにユーザスタディでは,コーディング標準のリンタ設定における開発者の効率性の向上が示されている。
最後に、JavaScriptコーディング標準のためのESLint構成を生成し、他のプログラミング言語、コーディング標準、リンタで広く適用可能であることを示すことによって、このアプローチの汎用性を実証する。
関連論文リスト
- CodeSimpleQA: Scaling Factuality in Code Large Language Models [55.705748501461294]
本稿では,コード関連質問への回答において,LLMの実際の精度を評価するための総合的なベンチマークであるCodeSimpleQAを提案する。
また,66万サンプルの大規模インストラクションコーパスであるCodeSimpleQA-Instructを作成し,教師付き微調整と強化学習を組み合わせたポストトレーニングフレームワークを開発した。
論文 参考訳(メタデータ) (2025-12-22T14:27:17Z) - TreeCoder: Systematic Exploration and Optimisation of Decoding and Constraints for LLM Code Generation [2.2940141855172036]
TreeCoderは、デコーディングを候補プログラムのツリー検索として表現する。
TreeCoderは、CodeLlama、Mistral、DeepSeekなどのオープンソースモデルの精度を一貫して改善する。
論文 参考訳(メタデータ) (2025-11-27T09:59:39Z) - CodeAlignBench: Assessing Code Generation Models on Developer-Preferred Code Adjustments [1.3999481573773072]
本稿では,命令追従機能の評価を行うマルチ言語ベンチマークを提案する。
本ベンチマークでは、初期問題に規定された事前定義された制約の順守と、フォローアップ命令に基づいて改善を行う能力の2つの主要な設定で命令に従うことを評価する。
論文 参考訳(メタデータ) (2025-10-31T15:47:07Z) - IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - AutoPLC: Generating Vendor-Aware Structured Text for Programmable Logic Controllers [9.209415852653386]
AutoPLCは、ベンダーが認識するSTコードを自動的に自然言語要求から生成できるフレームワークである。
Siemens TIA PortalとCODESYSプラットフォーム向けに実装されている。
AutoPLCは914タスクベンチマークで90%以上のコンパイル成功を実現しています。
論文 参考訳(メタデータ) (2024-12-03T12:05:56Z) - Crystal: Illuminating LLM Abilities on Language and Code [58.5467653736537]
本稿では,自然言語と符号化機能の統合性を高めるための事前学習戦略を提案する。
結果のモデルであるCrystalは、両方のドメインで顕著な能力を示します。
論文 参考訳(メタデータ) (2024-11-06T10:28:46Z) - CodeT5+: Open Code Large Language Models for Code Understanding and
Generation [72.1638273937025]
大きな言語モデル (LLM) は膨大なソースコードで事前訓練されており、コードインテリジェンスにおいて顕著な進歩を遂げている。
CodeT5+は、コンポーネントモジュールを柔軟に組み合わせて、幅広い下流のコードタスクに適合させることができるコードのためのエンコーダ-デコーダLLMのファミリーである。
我々は、ゼロショット、微調整、命令調整を含む20以上のコード関連ベンチマークでCodeT5+を広範囲に評価した。
論文 参考訳(メタデータ) (2023-05-13T14:23:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。