論文の概要: Inferring Attributed Grammars from Parser Implementations
- arxiv url: http://arxiv.org/abs/2507.13117v1
- Date: Thu, 17 Jul 2025 13:32:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.519408
- Title: Inferring Attributed Grammars from Parser Implementations
- Title(参考訳): パーザ実装による分散文法の推定
- Authors: Andreas Pointner, Josef Pichler, Herbert Prähofer,
- Abstract要約: 本稿では,入力文法の実装から属性文法を推定する新しい手法を提案する。
実行時の実行を観察し,プログラムの振る舞いを文法にマッピングすることにより,文法規則に意味的アクションを体系的に抽出し,組み込む。
プログラムの初期セットを用いて,提案手法の有効性を実証し,生成した属性文法を用いてプログラムの動作を正確に再現可能であることを示す。
- 参考スコア(独自算出の注目度): 1.0217990949413291
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Software systems that process structured inputs often lack complete and up-to-date specifications, which specify the input syntax and the semantics of input processing. While grammar mining techniques have focused on recovering syntactic structures, the semantics of input processing remains largely unexplored. In this work, we introduce a novel approach for inferring attributed grammars from parser implementations. Given an input grammar, our technique dynamically analyzes the implementation of recursive descent parsers to reconstruct the semantic aspects of input handling, resulting in specifications in the form of attributed grammars. By observing program executions and mapping the program's runtime behavior to the grammar, we systematically extract and embed semantic actions into the grammar rules. This enables comprehensive specification recovery. We demonstrate the feasibility of our approach using an initial set of programs, showing that it can accurately reproduce program behavior through the generated attributed grammars.
- Abstract(参考訳): 構造化された入力を処理するソフトウェアシステムは、入力の構文と入力処理の意味を規定する完全かつ最新の仕様を欠いていることが多い。
文法マイニング技術は構文構造の回復に重点を置いているが、入力処理のセマンティクスはほとんど解明されていない。
本研究では,パーサの実装から属性付き文法を推論する新しい手法を提案する。
入力文法が与えられた場合,提案手法は帰納的降下解析器の実装を動的に解析し,入力処理のセマンティックな側面を再構築し,属性文法の形で仕様書を作成する。
プログラムの実行を観察し、プログラムの実行動作を文法にマッピングすることにより、文法規則に意味的アクションを体系的に抽出し、組み込む。
これにより、包括的な仕様回復が可能になる。
プログラムの初期セットを用いて,提案手法の有効性を実証し,生成した属性文法を用いてプログラムの動作を正確に再現可能であることを示す。
関連論文リスト
- Leveraging Grammar Induction for Language Understanding and Generation [7.459693992079273]
言語理解と生成のための教師なし文法帰納法を提案する。
我々は,下流タスクで同時に訓練された選挙区構造と係り受け関係を誘導する文法を構築した。
複数の機械翻訳タスクの自然言語理解タスクに対して,本手法の評価と適用を行った。
論文 参考訳(メタデータ) (2024-10-07T09:57:59Z) - Semantic Parsing with Candidate Expressions for Knowledge Base Question Answering [4.795837146925278]
意味論は自然言語を論理形式に変換し、知識ベース(KB)で評価して記述を生成する。
シーケンシャル・ツー・シークエンス(seq2seq)事前訓練言語モデル(PLM)を用いた最近のセマンティックスの開発が進んでいる。
本稿では,Seq2seq PLMを用いた大容量KB上でのセマンティック解析の候補式を付加した文法を提案する。
論文 参考訳(メタデータ) (2024-10-01T05:46:22Z) - Grammar Induction from Visual, Speech and Text [91.98797120799227]
本研究は、新しい視覚音声テキスト文法誘導タスク(textbfVAT-GI)を導入する。
言語文法がテキストを超えて存在するという事実に触発されて、テキストは文法帰納において支配的なモダリティであってはならないと論じる。
そこで本稿では,豊富なモーダル特化機能と補完機能を有効文法解析に活用した,ビジュアル・オーディオ・テキスト・インサイド・アウトサイド・オートエンコーダ(textbfVaTiora)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-01T02:24:18Z) - Reverse Engineering Structure and Semantics of Input of a Binary Executable [0.0]
本稿では,バイナリ実行ファイルの入力のフィールド間の構造と意味関係を復元するアルゴリズムを提案する。
このアルゴリズムはByteRI 2.0と呼ばれるプロトタイプシステムで実装された。
論文 参考訳(メタデータ) (2024-05-22T22:47:33Z) - Weakly Supervised Semantic Parsing with Execution-based Spurious Program
Filtering [19.96076749160955]
本稿では,プログラムの実行結果に基づくドメインに依存しないフィルタリング機構を提案する。
私たちはこれらの表現に対して多数決を行い、他のプログラムと大きく異なる意味を持つプログラムを特定し、フィルタリングします。
論文 参考訳(メタデータ) (2023-11-02T11:45:40Z) - Compositional Program Generation for Few-Shot Systematic Generalization [59.57656559816271]
コンポジションプログラムジェネレータ(CPG)と呼ばれるニューロシンボリックアーキテクチャに関する研究
CPGには3つの重要な特徴がある: 文法規則の形で、テキストモジュラリティ、テキストコンポジション、テキストタストラクションである。
SCAN と COGS のベンチマークでは,SCAN の14例と COGS の22例を使用して,完全な一般化を実現している。
論文 参考訳(メタデータ) (2023-09-28T14:33:20Z) - Improving Generalization in Language Model-Based Text-to-SQL Semantic
Parsing: Two Simple Semantic Boundary-Based Techniques [14.634536051274468]
LMトークン化器が生成するトークンの意味的境界を保存するためのトークン前処理手法を提案する。
シーケンスレベルでは、入力と出力の間に整列したコンポーネントの境界を示すために特別なトークンを使うことを提案する。
2つのテキストからセマンティック・パーシング・データセットによる実験結果から,トークン前処理は単純ではあるが,両タイプの一般化におけるLM性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-05-27T06:09:03Z) - Benchmarking Language Models for Code Syntax Understanding [79.11525961219591]
事前学習された言語モデルは、自然言語処理とプログラム理解の両方において素晴らしい性能を示している。
本研究では,プログラムの構文構造を特定するための,最先端の事前訓練モデルの最初の徹底的なベンチマークを行う。
この結果から,既存のプログラミング言語の事前学習手法の限界が指摘され,構文構造をモデル化することの重要性が示唆された。
論文 参考訳(メタデータ) (2022-10-26T04:47:18Z) - BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and
Semantic Parsing [55.058258437125524]
本稿では,制約付きLanguage Model Parsingを評価するベンチマークであるBenchCLAMPを紹介する。
APIを通じてのみ利用可能な2つのGPT-3変種を含む8つの言語モデルをベンチマークする。
実験により,エンコーダ-デコーダ事前学習言語モデルでは,モデル出力が有効であると制約された場合に,構文解析や意味解析の最先端手法を超えることができることがわかった。
論文 参考訳(メタデータ) (2022-06-21T18:34:11Z) - Syntax-Aware Network for Handwritten Mathematical Expression Recognition [53.130826547287626]
手書き数式認識(HMER)は、多くの潜在的な応用が可能な課題である。
HMERの最近の手法はエンコーダ・デコーダアーキテクチャで優れた性能を実現している。
本稿では,構文情報をエンコーダ・デコーダネットワークに組み込んだHMERの簡易かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-03-03T09:57:19Z) - Enforcing Consistency in Weakly Supervised Semantic Parsing [68.2211621631765]
本稿では,関連する入力に対する出力プログラム間の整合性を利用して,スプリアスプログラムの影響を低減することを提案する。
より一貫性のあるフォーマリズムは、一貫性に基づくトレーニングを必要とせずに、モデルパフォーマンスを改善することにつながります。
論文 参考訳(メタデータ) (2021-07-13T03:48:04Z) - Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。
モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。
これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文 参考訳(メタデータ) (2020-12-23T20:40:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。