論文の概要: Unsupervised Discontinuous Constituency Parsing with Mildly
Context-Sensitive Grammars
- arxiv url: http://arxiv.org/abs/2212.09140v2
- Date: Fri, 9 Jun 2023 15:42:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 17:54:57.537156
- Title: Unsupervised Discontinuous Constituency Parsing with Mildly
Context-Sensitive Grammars
- Title(参考訳): 軽度文脈感性文法を用いた教師なし不連続成分解析
- Authors: Songlin Yang, Roger P. Levy, Yoon Kim
- Abstract要約: 教師なし不連続構文解析のための文脈に敏感な文法を用いた文法帰納法について検討した。
提案手法はルール構造を事前に修正し,パラメータ学習を最大限に活用することに焦点を当てる。
ドイツ語とオランダ語の実験から,我々の手法は連続的かつ不連続な構造を持つ言語的に意味のある木を誘導できることが示された。
- 参考スコア(独自算出の注目度): 14.256041558454786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study grammar induction with mildly context-sensitive grammars for
unsupervised discontinuous parsing. Using the probabilistic linear context-free
rewriting system (LCFRS) formalism, our approach fixes the rule structure in
advance and focuses on parameter learning with maximum likelihood. To reduce
the computational complexity of both parsing and parameter estimation, we
restrict the grammar formalism to LCFRS-2 (i.e., binary LCFRS with fan-out two)
and further discard rules that require O(n^6) time to parse, reducing inference
to O(n^5). We find that using a large number of nonterminals is beneficial and
thus make use of tensor decomposition-based rank-space dynamic programming with
an embedding-based parameterization of rule probabilities to scale up the
number of nonterminals. Experiments on German and Dutch show that our approach
is able to induce linguistically meaningful trees with continuous and
discontinuous structures
- Abstract(参考訳): 非教師なし不連続解析のための軽度文脈感応文法を用いた文法帰納法について検討した。
確率的線形文脈自由書き換えシステム (lcfrs) 形式を用いて, 規則構造を事前に修正し, 最大確率でパラメータ学習に焦点をあてた。
解析とパラメータ推定の両方の計算の複雑さを減らすため、文法形式を lcfrs-2 に制限し、さらに解析に o(n^6) 時間を要するルールを破棄し、o(n^5) への推論を減少させる。
多数の非終端数を用いることは有用であり、したがってテンソル分解に基づく階数空間動的プログラミングと、非終端数のスケールアップにルール確率の埋め込みに基づくパラメータ化を用いる。
ドイツ語とオランダ語の実験により,我々のアプローチは連続的かつ不連続な構造を持つ言語的に有意義な木を誘導できることを示した。
関連論文リスト
- Tractable Offline Learning of Regular Decision Processes [50.11277112628193]
この研究は、正則決定過程(RDP)と呼ばれる非マルコフ環境のクラスにおけるオフライン強化学習(RL)を研究する。
インスは、未来の観測と過去の相互作用からの報酬の未知の依存を実験的に捉えることができる。
多くのアルゴリズムは、まずこの未知の依存関係を自動学習技術を用いて再構築する。
論文 参考訳(メタデータ) (2024-09-04T14:26:58Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Learning of Structurally Unambiguous Probabilistic Grammars [7.347989843033034]
CMTAは確率文法に変換可能であることを示す。
学習したCMTAは、構造的に曖昧な確率論的文脈自由文法を学習するための完全なアルゴリズムに変換可能であることを示す。
論文 参考訳(メタデータ) (2022-03-17T17:01:51Z) - Recursive Bayesian Networks: Generalising and Unifying Probabilistic
Context-Free Grammars and Dynamic Bayesian Networks [0.0]
確率的文脈自由文法 (PCFGs) と動的ベイズネットワーク (DBNs) は相補的な強みと制約を持つシーケンスモデルとして広く使われている。
本稿では,PCFGとDBNを一般化・統合するRecursive Bayesian Networks(RBNs)について述べる。
論文 参考訳(メタデータ) (2021-11-02T19:21:15Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - PCFGs Can Do Better: Inducing Probabilistic Context-Free Grammars with
Many Symbols [22.728124473130876]
テンソル分解に基づくPCFGの新しいパラメータ化形式を提案する。
ニューラルパラメタライゼーションを新しい形式に応用し,教師なし解析性能を向上させる。
10言語のモデルを評価し、より多くのシンボルの使用の有効性を実証しています。
論文 参考訳(メタデータ) (2021-04-28T12:25:27Z) - Synthesizing Context-free Grammars from Recurrent Neural Networks
(Extended Version) [6.3455238301221675]
訓練されたリカレントニューラルネットワーク(RNN)から文脈自由文法(CFG)を抽出するアルゴリズムを提案する。
非正規言語を近似した決定論的有限オートマトン(DFAs)のシーケンスを記述する新しいフレームワークであるパターンルールセット(PRS)を開発した。
PRSがCFGにどのように変換されるかを示し、学習言語に親しみやすく有用なプレゼンテーションを可能にする。
論文 参考訳(メタデータ) (2021-01-20T16:22:25Z) - Learning of Structurally Unambiguous Probabilistic Grammars [7.347989843033034]
我々は構造的に曖昧な重み付き文脈自由文法(SUWCFG)に注意を向ける。
共線形乗数木オートマトン(CMTA)を用いてSUWCFGを表現できることを示し,CMTAを学習する学習アルゴリズムを提供する。
ゲノムデータを用いたPCFG学習におけるアルゴリズムの有用性を示す。
論文 参考訳(メタデータ) (2020-11-15T08:07:04Z) - Learning Implicitly with Noisy Data in Linear Arithmetic [94.66549436482306]
PAC-セマンティックスにおける暗黙学習を拡張し、線形算術の言語における間隔としきい値の不確実性を扱う。
最適線形プログラミング対象制約の学習に対する我々の暗黙的アプローチは、実際的な明示的アプローチよりも著しく優れていることを示す。
論文 参考訳(メタデータ) (2020-10-23T19:08:46Z) - Lagrangian Decomposition for Neural Network Verification [148.0448557991349]
ニューラルネットワーク検証の基本的なコンポーネントは、出力が取ることのできる値のバウンダリの計算である。
ラグランジアン分解に基づく新しい手法を提案する。
ランニングタイムのごく一部で、既成の解法に匹敵するバウンダリが得られることを示す。
論文 参考訳(メタデータ) (2020-02-24T17:55:10Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。