論文の概要: Scaling Up Toward Automated Black-box Reverse Engineering of
Context-Free Grammars
- arxiv url: http://arxiv.org/abs/2308.06163v1
- Date: Fri, 11 Aug 2023 14:45:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 14:28:32.392200
- Title: Scaling Up Toward Automated Black-box Reverse Engineering of
Context-Free Grammars
- Title(参考訳): 文脈自由文法の自動ブラックボックスリバースエンジニアリングへのスケールアップ
- Authors: Mohammad Rifat Arefin, Suraj Shetiya, Zili Wang and Christoph Csallner
- Abstract要約: State-of-the-artアプローチは、平らなパースツリーから始まる文法規則を一般化する。
我々は、Arvadaの一般化手順の多くが、一般的な言語概念のネストルールに違反していることを観察する。
結果として、TreeVadaはより高速なランタイムとより高品質な文法を経験的に比較した。
- 参考スコア(独自算出の注目度): 7.637155559284357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Black-box context-free grammar inference is a hard problem as in many
practical settings it only has access to a limited number of example programs.
The state-of-the-art approach Arvada heuristically generalizes grammar rules
starting from flat parse trees and is non-deterministic to explore different
generalization sequences. We observe that many of Arvada's generalization steps
violate common language concept nesting rules. We thus propose to pre-structure
input programs along these nesting rules, apply learnt rules recursively, and
make black-box context-free grammar inference deterministic. The resulting
TreeVada yielded faster runtime and higher-quality grammars in an empirical
comparison.
- Abstract(参考訳): ブラックボックスの文脈自由文法推論は難しい問題であり、多くの実用的な設定では限られた数のサンプルプログラムへのアクセスしかできない。
最先端のアプローチであるarvada heuristicは、フラットパース木から始まって文法規則を一般化し、異なる一般化列を探索する非決定論的である。
Arvadaの一般化手順の多くは、一般的な言語概念のネストルールに違反している。
そこで我々は,これらの入れ子規則に沿って入力プログラムを事前構成し,学習規則を帰納的に適用し,ブラックボックスの文脈自由文法推論を決定論的にする。
結果として、TreeVadaはより高速なランタイムとより高品質な文法を経験的に比較した。
関連論文リスト
- Incremental Context-free Grammar Inference in Black Box Settings [17.601446198181048]
ブラックボックスの文脈自由文法推論は多くの実践的な設定において重要な課題である。
そこで本研究では,サンプル文字列をより小さな単位に分割し,文法を漸進的に推論する手法を提案する。
我々の手法であるKedavraは、より優れた文法品質(精度とリコールの強化)、より高速な実行、経験的比較による可読性の向上を実証した。
論文 参考訳(メタデータ) (2024-08-29T17:00:38Z) - Sparse Logistic Regression with High-order Features for Automatic Grammar Rule Extraction from Treebanks [6.390468088226495]
本研究では,木バンクから重要な粒度の文法パターンを抽出し,探索する手法を提案する。
我々は,異なる言語にまたがる記述や規則を抽出し,合意と語順の2つの言語現象について考察する。
我々の手法は、スペイン語、フランス語、ウーロフにおける有名な文法規則とあまり知られていない重要な文法規則の両方を捉えている。
論文 参考訳(メタデータ) (2024-03-26T09:39:53Z) - Compositional Program Generation for Few-Shot Systematic Generalization [59.57656559816271]
コンポジションプログラムジェネレータ(CPG)と呼ばれるニューロシンボリックアーキテクチャに関する研究
CPGには3つの重要な特徴がある: 文法規則の形で、テキストモジュラリティ、テキストコンポジション、テキストタストラクションである。
SCAN と COGS のベンチマークでは,SCAN の14例と COGS の22例を使用して,完全な一般化を実現している。
論文 参考訳(メタデータ) (2023-09-28T14:33:20Z) - ChatRule: Mining Logical Rules with Large Language Models for Knowledge
Graph Reasoning [107.61997887260056]
そこで我々は,知識グラフ上の論理ルールをマイニングするための大規模言語モデルの力を解き放つ新しいフレームワークChatRuleを提案する。
具体的には、このフレームワークは、KGのセマンティック情報と構造情報の両方を活用するLLMベースのルールジェネレータで開始される。
生成されたルールを洗練させるために、ルールランキングモジュールは、既存のKGから事実を取り入れてルール品質を推定する。
論文 参考訳(メタデータ) (2023-09-04T11:38:02Z) - Efficient Semiring-Weighted Earley Parsing [71.77514972816347]
本稿では,様々なスピードアップを伴うEarey (1970) の文脈自由構文解析アルゴリズムの,推論システムという形での参照記述を提供する。
私たちのプレゼンテーションには、Earey氏の$O(N3|GR|)$から、既知の最悪のランタイム改善が含まれています。
半重み付き推論への一般化を扱い、Stolcke (1995)のような文法を前処理して推論サイクルを排除し、さらに文プレフィックスの重みを計算するStolckeの手法を一般化する。
論文 参考訳(メタデータ) (2023-07-06T13:33:59Z) - On Parsing as Tagging [66.31276017088477]
そこで我々は,現在最先端の選挙区タグであるテトラタグを減らして,シフト-リデュース解析を行う方法を示す。
我々は、線形化器、学習者、復号器の異なる選択でタグ付けパイプラインの分類を実証的に評価する。
論文 参考訳(メタデータ) (2022-11-14T13:37:07Z) - Learning of Structurally Unambiguous Probabilistic Grammars [7.347989843033034]
CMTAは確率文法に変換可能であることを示す。
学習したCMTAは、構造的に曖昧な確率論的文脈自由文法を学習するための完全なアルゴリズムに変換可能であることを示す。
論文 参考訳(メタデータ) (2022-03-17T17:01:51Z) - Learning grammar with a divide-and-concur neural network [4.111899441919164]
本研究では,文脈自由文法推論に対する分割・コンカレント反復予測手法を実装した。
本手法は比較的少数の離散パラメータを必要とするため,推測文法を直接解釈可能である。
論文 参考訳(メタデータ) (2022-01-18T22:42:43Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Learning of Structurally Unambiguous Probabilistic Grammars [7.347989843033034]
我々は構造的に曖昧な重み付き文脈自由文法(SUWCFG)に注意を向ける。
共線形乗数木オートマトン(CMTA)を用いてSUWCFGを表現できることを示し,CMTAを学習する学習アルゴリズムを提供する。
ゲノムデータを用いたPCFG学習におけるアルゴリズムの有用性を示す。
論文 参考訳(メタデータ) (2020-11-15T08:07:04Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。