論文の概要: Correctness-Guaranteed Code Generation via Constrained Decoding
- arxiv url: http://arxiv.org/abs/2508.15866v1
- Date: Wed, 20 Aug 2025 20:48:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.132529
- Title: Correctness-Guaranteed Code Generation via Constrained Decoding
- Title(参考訳): 制約付きデコードによる正確性保証コード生成
- Authors: Lingxiao Li, Salar Rahili, Yiwei Zhao,
- Abstract要約: 本稿では,意味論的に正しいプログラムを生成するための制約付き実行時復号アルゴリズムを提案する。
提案手法は,任意の所定のスクリプティングAPIに従って,意味的に正しいプログラムを生成することができることを示す。
さらに、慎重に設計することで、我々のセマンティック保証が正当性にまで拡張され、ローグライクなビデオゲームにゲームメカニクスを発生させることで検証されることを示す。
- 参考スコア(独自算出の注目度): 11.531496728670746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language Models (LMs) are increasingly being used for code generation, but ensuring the correctness of generated programs remains a significant challenge. Although imperfect code may be acceptable during software development with human oversight, domains such as video games and robotics require one-shot correctness for runtime-critical components. We present a constrained decoding algorithm for generating semantically correct programs that incorporates a context-sensitive parser, which, at each step, outputs a regular expression that satisfies a critical non-extensible property to guide the generation of the next token sequence that can continue to a correct program. To build such a context-sensitive parser, we propose a framework of a dynamic tree of parsers (ToP) during parsing, where each parser corresponds to a modular context-free grammar enriched with contextual information such as variable scopes and type constraints, with tree branches representing ambiguity in the future code segment. We demonstrate our approach through sLua, a strongly typed variant of Lua, showing that our method can generate semantically correct programs conforming to any prescribed scripting API. We further show that, with careful design, our semantic guarantees extend to runtime correctness, as validated in the application of generating game mechanics for a roguelike video game.
- Abstract(参考訳): 言語モデル(LM)はコード生成にますます使われていますが、生成されたプログラムの正確性を保証することは大きな課題です。
人間の監視によるソフトウェア開発において不完全なコードは受け入れられるかもしれないが、ビデオゲームやロボティクスのようなドメインは実行時クリティカルなコンポーネントに対してワンショットの正当性を必要とする。
本稿では、文脈に敏感なパーサを組み込んだ意味論的に正しいプログラムを生成するための制約付き復号アルゴリズムを提案し、各ステップにおいて、重要な非拡張性を満たす正規表現を出力し、正しいプログラムを継続可能な次のトークンシーケンスの生成を導く。
このような文脈に敏感なパーサを構築するために、解析中のパーサの動的ツリー(ToP)のフレームワークを提案し、各パーサは、変数スコープや型制約といったコンテキスト情報に富んだモジュラーな文脈自由文法に対応し、将来のコードセグメントにおけるあいまいさを表すツリーブランチを持つ。
我々は,Luaの強く型付けされた変種であるsLuaによるアプローチを実証し,任意の所定のスクリプティングAPIに準拠した意味的に正しいプログラムを生成可能であることを示す。
さらに、慎重に設計することで、我々のセマンティック保証が実行時正当性にまで拡張され、ローグライクなビデオゲームにゲームメカニクスを発生させることで検証されることを示す。
関連論文リスト
- Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering [4.795837146925278]
意味論は自然言語を論理形式に変換し、知識ベース(KB)で評価して記述を生成する。
シーケンシャル・ツー・シークエンス(seq2seq)事前訓練言語モデル(PLM)を用いた最近のセマンティックスの開発が進んでいる。
本稿では,Seq2seq PLMを用いた大容量KB上でのセマンティック解析の候補式を付加した文法を提案する。
論文 参考訳(メタデータ) (2024-10-01T05:46:22Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
CodeGRAGは、制御フローとそれらのデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミングドメインの知識をよりよく解釈する。
CodeGRAGはLLMのコード生成能力を大幅に改善し、言語間コード生成のパフォーマンス向上も実現している。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - Constrained Decoding for Fill-in-the-Middle Code Language Models via Efficient Left and Right Quotienting of Context-Sensitive Grammars [11.279507894576213]
本稿では,構文的に正しくないコードの早期拒絶を可能にするインクリメンタルな合成に寄与する。
文脈自由文法の左右商を許容するために、Earey解析アルゴリズムを拡張した。
論文 参考訳(メタデータ) (2024-02-28T02:12:47Z) - Outline, Then Details: Syntactically Guided Coarse-To-Fine Code
Generation [61.50286000143233]
ChainCoderは、Pythonコードを段階的に生成するプログラム合成言語モデルである。
自然言語記述と構文的に整合したI/Oデータサンプルを共同で符号化するために、カスタマイズされたトランスフォーマーアーキテクチャを利用する。
論文 参考訳(メタデータ) (2023-04-28T01:47:09Z) - Transformer with Tree-order Encoding for Neural Program Generation [8.173517923612426]
木に基づく位置エンコーディングと、トランスフォーマーのための自然言語サブワード語彙の共有を導入する。
その結果,木に基づく位置符号化と自然言語サブワード語彙の共有を併用することで,逐次的位置符号化よりも生成性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-30T12:27:48Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。