論文の概要: Text2DSL: LLM-Based Code Generation for Domain-Specific Languages
- arxiv url: http://arxiv.org/abs/2606.22586v1
- Date: Sun, 21 Jun 2026 16:44:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:30:00.61983
- Title: Text2DSL: LLM-Based Code Generation for Domain-Specific Languages
- Title(参考訳): Text2DSL: ドメイン特化言語のためのLLMベースのコード生成
- Authors: Alexander V. Kozachok, Alexander M. Nazimov, Shamil G. Magomedov,
- Abstract要約: 本稿では、自然言語記述からDSLコードを自動的に生成するタスクであるText2を定式化する。
我々は,PolkitBenchデータセットを導入し,4,204個の自然言語対を検証した。
- 参考スコア(独自算出の注目度): 78.29352305480285
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain-specific languages (DSLs) are widely used for managing operating system security policies, yet manually authoring rules in such languages demands high expertise and is error-prone. This paper formalises the task of automatic DSL code generation from natural language descriptions - Text2DSL - as a distinct problem class, separate from Text-to-SQL and general-purpose code generation. We introduce the PolkitBench dataset comprising 4,204 verified natural-language-to-Polkit-rule pairs, each validated through a three-level AST-based pipeline. Controlled prompt experiments on two MoE models of different scale and provenance - GigaChat-10B-A1.8B (1.8B active parameters) and Nemotron-3-Nano-30B-A3B (3B active) - demonstrate the critical role of structured context (BNF grammar, API specification, permitted identifier vocabulary) for LLM-based DSL code generation. Across both models, supplying context raises syntactic validity to 98.6-99.4%, structural validity by +9.7 to +35.5 pp, and the CodeBLEU score by +60% to +95%. The consistency of the effect across models of different scale and provenance indicates that, for the Text2DSL class of problems, injecting a formal target-language specification into the prompt context is a robust enabling factor for high-quality generation without model fine-tuning.
- Abstract(参考訳): ドメイン固有言語(DSL)は、オペレーティングシステムのセキュリティポリシーを管理するために広く使われているが、そのような言語でルールを手動で作成するには高度な専門知識が必要であり、エラーを起こしやすい。
本稿では,Text-to-SQLと汎用コード生成とは別個の問題クラスとして,自然言語記述(Text2DSL)からDSLコードの自動生成のタスクを定式化する。
また,PolkitBenchデータセットは,3レベルASTベースのパイプラインを用いて検証し,それぞれ4,204個の自然言語-ポリシット-ルールペアを検証した。
GigaChat-10B-A1.8B(1.8Bのアクティブパラメータ)とNemotron-3-Nano-30B-A3B(3Bのアクティブパラメータ)の2つのMoEモデルの迅速な実験は、LLMベースのDSLコード生成における構造化コンテキスト(BNF文法、API仕様、許容識別子語彙)の重要な役割を実証している。
どちらのモデルでも、供給コンテキストは構文的妥当性を98.6-99.4%、構造的妥当性を+9.7から+35.5pp、CodeBLEUスコアを+60%から+95%に向上させる。
異なるスケールと証明のモデル間での効果の一貫性は、Text2DSLのクラスでは、プロンプトコンテキストに形式的なターゲット言語仕様を注入することは、モデル微調整なしで高品質な生成を可能にする堅牢な要因であることを示している。
関連論文リスト
- Context-Aware Distillation and Ablation for Text2DSL [78.29352305480285]
我々は、コンテクスト対応蒸留により、プロンプトのみの合成生成を置き換える。
教師の大きな言語モデルは、明示的に定義された構造化コンテキストの下で機能する。
これは、検証されたポルキットベンチコーパスを4,204対から10,073対にスケールする。
論文 参考訳(メタデータ) (2026-06-21T16:27:24Z) - Leveraging LLMs for Multi-File DSL Code Generation: An Industrial Case Study [39.936784974007644]
大規模言語モデル(LLM)は汎用コード生成に強く貢献するが、エンタープライズドメイン特化言語(s)への適用性は未定である。
本稿では,コード指向のLLMを用いて,Xtext ベースの DSL 用のプロジェクトルート DSL アーチファクトの生成と修正を行う,BMW の産業ケーススタディについて報告する。
構造化されたパス応答生成をリポジトリスケールでエンコードし、ファイル間の依存関係を学習します。
論文 参考訳(メタデータ) (2026-04-27T16:38:01Z) - Bilingual Text-to-Motion Generation: A New Benchmark and Baselines [52.71312720094036]
LLMアノテーションと厳密な手動修正によって構築されたバイリンガルテキスト・モーション・ベンチマークであるBiHumanML3Dを紹介する。
また,CLA(Cross-Lingual Alignment)を用いたバイリンガルモーション拡散合成(BiMD)を提案する。
CLA を用いた BiMD は 0.045 対 0.169 対 R@3 対 80.8% の FID を達成し、単言語拡散モデルと BiHumanML3D の翻訳ベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2026-03-26T08:48:27Z) - InstructLR: A Scalable Approach to Create Instruction Dataset for Under-Resourced Languages [5.046479786355341]
本稿では,低リソース言語(LRL)のための高品質な命令データセットを生成するための新しいフレームワークであるInstructLRを紹介する。
提案手法は,LLMによるテキスト生成と2層品質フィルタリング機構を統合する。
InstructLRはZarma Instruct-50k、Bambara Instruct-50k、Fulfulde Instruct-50kという3つのマルチドメイン命令ベンチマークの作成を容易にする。
論文 参考訳(メタデータ) (2025-12-01T21:25:33Z) - IFEvalCode: Controlled Code Generation [69.28317223249358]
本稿では,Code LLMの命令追従能力を改善するために,前方および後方制約生成を提案する。
IFEvalCodeは、7つのプログラミング言語の1.6Kテストサンプルからなる多言語ベンチマークである。
論文 参考訳(メタデータ) (2025-07-30T08:08:48Z) - Guiding Large Language Models to Generate Computer-Parsable Content [0.6798775532273751]
本研究では,特定の規則に忠実な構造化コンテンツを生成する際に,微調整なしでLLM(Large Language Models)をガイドする方法を提案する。
これにより、ターゲットデータ構造、型、命令を生成する際の安定性と一貫性が向上し、アプリケーション開発の複雑さが軽減される。
論文 参考訳(メタデータ) (2024-04-08T13:22:24Z) - PolyLM: An Open Source Polyglot Large Language Model [57.64420154135178]
我々は6400億(B)トークンでトレーニングされた多言語大言語モデル(LLM)であるPolyLMについて述べる。
その多言語的能力を高めるために,1) バイリンガルデータをトレーニングデータに統合し,2) 事前学習中に英語以外のデータの比率を30%から60%に引き上げるカリキュラム学習戦略を採用する。
さらに,モデル微調整のために,132.7Kの多言語命令を自動的に生成する多言語自己指示手法を提案する。
論文 参考訳(メタデータ) (2023-07-12T09:00:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。