論文の概要: Learning of Structurally Unambiguous Probabilistic Grammars
- arxiv url: http://arxiv.org/abs/2011.07472v2
- Date: Tue, 9 Mar 2021 18:32:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 07:39:38.240416
- Title: Learning of Structurally Unambiguous Probabilistic Grammars
- Title(参考訳): 構造的に曖昧な確率文法の学習
- Authors: Dolav Nitay, Dana Fisman, Michal Ziv-Ukelson
- Abstract要約: 我々は構造的に曖昧な重み付き文脈自由文法(SUWCFG)に注意を向ける。
共線形乗数木オートマトン(CMTA)を用いてSUWCFGを表現できることを示し,CMTAを学習する学習アルゴリズムを提供する。
ゲノムデータを用いたPCFG学習におけるアルゴリズムの有用性を示す。
- 参考スコア(独自算出の注目度): 7.347989843033034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of identifying a probabilistic context free grammar has two
aspects: the first is determining the grammar's topology (the rules of the
grammar) and the second is estimating probabilistic weights for each rule.
Given the hardness results for learning context-free grammars in general, and
probabilistic grammars in particular, most of the literature has concentrated
on the second problem. In this work we address the first problem. We restrict
attention to structurally unambiguous weighted context-free grammars (SUWCFG)
and provide a query learning algorithm for structurally unambiguous
probabilistic context-free grammars (SUPCFG). We show that SUWCFG can be
represented using co-linear multiplicity tree automata (CMTA), and provide a
polynomial learning algorithm that learns CMTAs. We show that the learned CMTA
can be converted into a probabilistic grammar, thus providing a complete
algorithm for learning a structurally unambiguous probabilistic context free
grammar (both the grammar topology and the probabilistic weights) using
structured membership queries and structured equivalence queries. We
demonstrate the usefulness of our algorithm in learning PCFGs over genomic
data.
- Abstract(参考訳): 確率的文脈自由文法を識別する問題は2つの側面がある: 1つは文法の位相(文法の規則)を決定すること、2つ目は確率的重みを各規則に対して推定することである。
文脈自由文法の学習の難しさ、特に確率文法の難しさを考えると、ほとんどの文献は第二の問題に集中している。
この作業では、最初の問題に対処します。
我々は、構造的に曖昧な文脈自由文法(SUWCFG)に注意を向け、構造的に曖昧な確率的文脈自由文法(SUPCFG)に対するクエリ学習アルゴリズムを提供する。
共線形乗数木オートマトン(CMTA)を用いてSUWCFGを表現できることを示し,CMTAを学習する多項式学習アルゴリズムを提案する。
学習したcmtaを確率的文法に変換することができ、構造的非曖昧な確率的文脈自由文法(文法トポロジーと確率的重みの両方)を構造的メンバーシップクエリと構造的等価クエリを用いて学習するための完全なアルゴリズムを提供する。
ゲノムデータを用いたPCFG学習におけるアルゴリズムの有用性を示す。
関連論文リスト
- Detecting and explaining (in)equivalence of context-free grammars [0.6282171844772422]
文脈自由文法の同値性を決定し,証明し,説明するためのスケーラブルなフレームワークを提案する。
本稿では,本フレームワークの実装と,教育支援システム内で収集された大規模データセット上での評価を行う。
論文 参考訳(メタデータ) (2024-07-25T17:36:18Z) - Sparse Logistic Regression with High-order Features for Automatic Grammar Rule Extraction from Treebanks [6.390468088226495]
本研究では,木バンクから重要な粒度の文法パターンを抽出し,探索する手法を提案する。
我々は,異なる言語にまたがる記述や規則を抽出し,合意と語順の2つの言語現象について考察する。
我々の手法は、スペイン語、フランス語、ウーロフにおける有名な文法規則とあまり知られていない重要な文法規則の両方を捉えている。
論文 参考訳(メタデータ) (2024-03-26T09:39:53Z) - Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.68385617116854]
トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部動作を理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがこのCFG言語を正確に学習し、それに基づいて文を生成することを実証する。
論文 参考訳(メタデータ) (2023-05-23T04:28:16Z) - Logical Entity Representation in Knowledge-Graphs for Differentiable
Rule Learning [71.05093203007357]
本稿では,知識グラフ内のエンティティのコンテキスト情報をエンコードするための論理エンティティ・リプレゼンテーション(LERP)を提案する。
LERPは、エンティティの隣接部分グラフ上の確率論的論理関数のベクトルとして設計されている。
我々のモデルは知識グラフ補完において他のルール学習法よりも優れており、最先端のブラックボックス法に匹敵する、あるいは優れている。
論文 参考訳(メタデータ) (2023-05-22T05:59:22Z) - Unsupervised Discontinuous Constituency Parsing with Mildly
Context-Sensitive Grammars [14.256041558454786]
教師なし不連続構文解析のための文脈に敏感な文法を用いた文法帰納法について検討した。
提案手法はルール構造を事前に修正し,パラメータ学習を最大限に活用することに焦点を当てる。
ドイツ語とオランダ語の実験から,我々の手法は連続的かつ不連続な構造を持つ言語的に意味のある木を誘導できることが示された。
論文 参考訳(メタデータ) (2022-12-18T18:10:45Z) - Learning of Structurally Unambiguous Probabilistic Grammars [7.347989843033034]
CMTAは確率文法に変換可能であることを示す。
学習したCMTAは、構造的に曖昧な確率論的文脈自由文法を学習するための完全なアルゴリズムに変換可能であることを示す。
論文 参考訳(メタデータ) (2022-03-17T17:01:51Z) - A Syntax-Guided Grammatical Error Correction Model with Dependency Tree
Correction [83.14159143179269]
文法的誤り訂正(英: Grammatical Error Correction, GEC)は、文中の文法的誤りを検出し、訂正するタスクである。
本稿では,依存木の構文知識を利用するためのグラフアテンション機構を採用した構文誘導型GECモデル(SG-GEC)を提案する。
我々は、GECタスクの公開ベンチマークでモデルを評価し、競争結果を得る。
論文 参考訳(メタデータ) (2021-11-05T07:07:48Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Probabilistic Grammars for Equation Discovery [0.0]
本稿では,確率論的文脈自由文法を方程式発見に用いることを提案する。
確率文法は、パーシモニー原理をエレガントかつ柔軟に定式化するために用いられる。
論文 参考訳(メタデータ) (2020-12-01T11:59:19Z) - A Constraint-Based Algorithm for the Structural Learning of
Continuous-Time Bayesian Networks [70.88503833248159]
連続時間ベイズネットワークの構造を学習するための制約に基づく最初のアルゴリズムを提案する。
我々は,条件付き独立性を確立するために提案した,異なる統計的テストと基礎となる仮説について論じる。
論文 参考訳(メタデータ) (2020-07-07T07:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。