論文の概要: Constrained Decoding for Code Language Models via Efficient Left and
Right Quotienting of Context-Sensitive Grammars
- arxiv url: http://arxiv.org/abs/2402.17988v1
- Date: Wed, 28 Feb 2024 02:12:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 16:33:26.766999
- Title: Constrained Decoding for Code Language Models via Efficient Left and
Right Quotienting of Context-Sensitive Grammars
- Title(参考訳): 文脈感性文法の左・右クオリティ化による符号言語モデルの制約付き復号法
- Authors: Daniel Melcer, Nathan Fulton, Sanjay Krishna Gouda, Haifeng Qian
- Abstract要約: 任意の文脈自由文法の左と右の商に対して作用するアールレー型タスクを開発する。
我々は、多くの共通プログラミング言語の文法に現れるいくつかの文脈依存機能に、インクリメンタル解析と商演算を拡張した。
- 参考スコア(独自算出の注目度): 12.322052060502276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models are powerful tools for program synthesis and advanced
auto-completion, but come with no guarantee that their output code is
syntactically correct. This paper contributes an incremental parser that allows
early rejection of syntactically incorrect code, as well as efficient detection
of complete programs for fill-in-the-middle (FItM) tasks. We develop
Earley-style parsers that operate over left and right quotients of arbitrary
context-free grammars, and we extend our incremental parsing and quotient
operations to several context-sensitive features present in the grammars of
many common programming languages. The result of these contributions is an
efficient, general, and well-grounded method for left and right quotient
parsing.
To validate our theoretical contributions -- and the practical effectiveness
of certain design decisions -- we evaluate our method on the particularly
difficult case of FItM completion for Python 3. Our results demonstrate that
constrained generation can significantly reduce the incidence of syntax errors
in recommended code.
- Abstract(参考訳): 大きな言語モデルはプログラム合成と高度なオートコンプリートのための強力なツールであるが、出力コードが構文的に正しいという保証はない。
本稿では,構文上の誤りを早期に否定できるインクリメンタル・パーサと,FItM(Fit-in-the-middle)タスクのための完全プログラムの効率的な検出に寄与する。
我々は任意の文脈自由文法の左および右クォージェントで作用するアールリー型構文解析器を開発し、そのインクリメンタル解析と商演算を、多くの共通プログラミング言語の文法に存在するいくつかの文脈依存的特徴に拡張する。
これらのコントリビューションの結果は、左と右の商解析の効率的で、一般的で、そしてしっかりとした方法である。
理論的なコントリビューション、そして特定の設計決定の実践的有効性を検証するため、我々はPython 3のFItM完了の特に難しいケースについて、我々の手法を評価します。
その結果,制約付き生成は推奨コードにおける構文エラーの発生率を大幅に削減できることがわかった。
関連論文リスト
- Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification [52.095460362197336]
大規模言語モデル(LLM)は一貫性と正確な推論に苦しむ。
LLMは、主に正しいソリューションに基づいて訓練され、エラーを検出して学習する能力を減らす。
本稿では,CoT(Chain-of-Thought)とPoT(Program-of-Thought)を組み合わせた新しい協調手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T05:21:48Z) - A Comprehensive Solution to Connect Speech Encoder and Large Language Model for ASR [14.380210167130032]
近年,音声認識のための言語エンコーダを大規模言語モデル (LLM) に接続する手法が提案されている。
しかし、微調整オプションの制限、音声テキストアライメントを強制するメカニズムの欠如、挿入エラーの増大など、いくつかの制限が続く。
本稿では,これらの課題に対処するための包括的解決策を提案する。
論文 参考訳(メタデータ) (2024-06-25T04:35:50Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Grammar-Aligned Decoding [30.972850034752884]
LLM(Large Language Models)は、プログラムコード、数学的公式、整形されたマークアップなどの高度に構造化された出力を確実に生成するのに苦労する。
制約付き復号法は、LLMが出力できるトークンを各ステップで厳格に制限し、出力が与えられた制約と一致することを保証することによってこの問題を軽減する。
本稿では,GCD技術がLLMの分布を歪め,文法的だがLLMに比例しない確率で現れる出力を導出することを示す。
論文 参考訳(メタデータ) (2024-05-31T17:39:15Z) - Understanding and Mitigating Classification Errors Through Interpretable
Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。
正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。
提案手法であるPremiseが実際によく動作することを示す。
論文 参考訳(メタデータ) (2023-11-18T00:24:26Z) - Tokenization with Factorized Subword Encoding [2.538209532048867]
本稿では,VQ-VAEモデルを用いて,サブワードを離散三重項に分解する新しいトークン化手法を提案する。
その結果, この手法は, 一般的に使用されるバイトペア符号化(BPE)トークン化アルゴリズムよりも, 形態的タスクに適しており, 頑健であることが示唆された。
論文 参考訳(メタデータ) (2023-06-13T13:27:34Z) - Weak Disambiguation for Partial Structured Output Learning [8.239028141030621]
部分構造的出力学習(WD-PSL)のための新しい弱い曖昧さを提案する。
各候補ラベルには、それが真のラベルである可能性を示す信頼値が割り当てられる。
自然言語処理におけるいくつかのシーケンスラベリングタスクの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-09-20T02:12:31Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - CodeBLEU: a Method for Automatic Evaluation of Code Synthesis [57.87741831987889]
コード合成の分野では、一般的に使用される評価基準はBLEUまたは完全精度である。
我々はCodeBLEUと呼ばれる新しい自動評価指標を導入する。
n-gramマッチングにおけるBLEUの強度を吸収し、抽象構文木(AST)やデータフローによるコードセマンティクスを通じてコード構文を注入する。
論文 参考訳(メタデータ) (2020-09-22T03:10:49Z) - Contextualized Perturbation for Textual Adversarial Attack [56.370304308573274]
逆例は自然言語処理(NLP)モデルの脆弱性を明らかにする。
本稿では,フロートおよび文法的出力を生成するContextualized AdversaRial Example生成モデルであるCLAREを提案する。
論文 参考訳(メタデータ) (2020-09-16T06:53:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。