論文の概要: Rule Augmented Unsupervised Constituency Parsing
- arxiv url: http://arxiv.org/abs/2105.10193v1
- Date: Fri, 21 May 2021 08:06:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:34:25.796907
- Title: Rule Augmented Unsupervised Constituency Parsing
- Title(参考訳): 規制強化型無監督選挙区パーシング
- Authors: Atul Sahay, Anshul Nasery, Ayush Maheshwari, Ganesh Ramakrishnan and
Rishabh Iyer
- Abstract要約: 本稿では,構文規則の形で存在する言語について,非常に汎用的な言語知識を活用するアプローチを提案する。
MNLIとWSJという2つのベンチマークデータセットで、最先端の新たな結果を得る。
- 参考スコア(独自算出の注目度): 11.775897250472116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, unsupervised parsing of syntactic trees has gained considerable
attention. A prototypical approach to such unsupervised parsing employs
reinforcement learning and auto-encoders. However, no mechanism ensures that
the learnt model leverages the well-understood language grammar. We propose an
approach that utilizes very generic linguistic knowledge of the language
present in the form of syntactic rules, thus inducing better syntactic
structures. We introduce a novel formulation that takes advantage of the
syntactic grammar rules and is independent of the base system. We achieve new
state-of-the-art results on two benchmarks datasets, MNLI and WSJ. The source
code of the paper is available at https://github.com/anshuln/Diora_with_rules.
- Abstract(参考訳): 近年,構文樹の教師なし解析が注目されている。
このような教師なし構文解析の原型的アプローチは強化学習と自動エンコーダを用いる。
しかし、学習モデルが十分に理解された言語文法を活用することを保証するメカニズムはない。
本稿では,構文規則の形で存在する言語に関する非常に一般的な言語知識を活用する手法を提案する。
本稿では,構文文法規則を活用し,ベースシステムとは独立な新しい定式化手法を提案する。
我々は、mnliとwsjという2つのベンチマークデータセットで最新の結果を得る。
論文のソースコードはhttps://github.com/anshuln/diora_with_rules.com/で入手できる。
関連論文リスト
- On Eliciting Syntax from Language Models via Hashing [19.872554909401316]
教師なし構文解析は、生のテキストから構文構造を推論することを目的としている。
本稿では,本機能を利用して生テキストから解析木を推定する可能性について検討する。
本手法は,事前学習した言語モデルから高品質な構文解析木を低コストで取得する上で,有効かつ効率的であることを示す。
論文 参考訳(メタデータ) (2024-10-05T08:06:19Z) - On Unsupervised Training of Link Grammar Based Language Models [0.0]
本稿では,リンク文法形式に基づく言語モデル構築に必要な終端タグ形式について紹介する。
第2に,統計的リンク文法形式を提唱し,統計的言語生成を可能にする。
第3に, 上記の形式主義に基づいて, 語彙抽出による言語関係の発見に関する古典的ユレットの論文 [25] が, 言語の文脈的特性を無視していることを示す。
論文 参考訳(メタデータ) (2022-08-27T14:07:24Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - Dependency Induction Through the Lens of Visual Perception [81.91502968815746]
本稿では,単語の具体性を利用した教師なし文法帰納モデルと,構成的視覚に基づく構成的文法を共同学習する手法を提案する。
実験により,提案した拡張は,文法的サイズが小さい場合でも,現在最先端の視覚的接地モデルよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-09-20T18:40:37Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z) - The Return of Lexical Dependencies: Neural Lexicalized PCFGs [103.41187595153652]
語彙化PCFGのニューラルモデルを提案する。
実験により、この統一されたフレームワークは、いずれかの形式主義単独で達成されるよりも、両方の表現に対してより強い結果をもたらすことが示された。
論文 参考訳(メタデータ) (2020-07-29T22:12:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。