論文の概要: Unsupervised Parsing via Constituency Tests
- arxiv url: http://arxiv.org/abs/2010.03146v1
- Date: Wed, 7 Oct 2020 04:05:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 22:09:29.742524
- Title: Unsupervised Parsing via Constituency Tests
- Title(参考訳): 構成テストによる教師なし構文解析
- Authors: Steven Cao, Nikita Kitaev, Dan Klein
- Abstract要約: 本稿では,選挙区検定の言語的概念に基づく教師なし解析手法を提案する。
文を与えられた木を生成するために,各木をその選挙区試験判定値の集計によりスコアし,最大スコアの2進木を選択する。
洗練されたモデルはPenn Treebankテストセット上で62.8 F1を達成する。
- 参考スコア(独自算出の注目度): 49.42244463346612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a method for unsupervised parsing based on the linguistic notion
of a constituency test. One type of constituency test involves modifying the
sentence via some transformation (e.g. replacing the span with a pronoun) and
then judging the result (e.g. checking if it is grammatical). Motivated by this
idea, we design an unsupervised parser by specifying a set of transformations
and using an unsupervised neural acceptability model to make grammaticality
decisions. To produce a tree given a sentence, we score each span by
aggregating its constituency test judgments, and we choose the binary tree with
the highest total score. While this approach already achieves performance in
the range of current methods, we further improve accuracy by fine-tuning the
grammaticality model through a refinement procedure, where we alternate between
improving the estimated trees and improving the grammaticality model. The
refined model achieves 62.8 F1 on the Penn Treebank test set, an absolute
improvement of 7.6 points over the previous best published result.
- Abstract(参考訳): 本稿では,選挙区検定の言語的概念に基づく教師なし解析手法を提案する。
あるタイプの選挙区試験は、ある変換(例えば、スパンを代名詞に置き換える)によって文を修正し、その結果を判断する(例えば、文法的かどうかを確認する)。
このアイデアに動機づけられ、一連の変換を特定し、教師なしの神経受容性モデルを使用して文法的決定を行うことで教師なしパーサを設計する。
文を与えられた木を生成するために,各木をその選挙区試験判定を集約してスコアし,最大スコアのバイナリツリーを選択する。
この手法は現在の手法の範囲での性能を既に達成しているが、精度をさらに向上させるため、改良手順を通じて文法性モデルを微調整し、推定木の改良と文法性モデルの改善を交互に行う。
改良されたモデルは、ペン・ツリーバンク・テストセットで62.8 f1を達成し、以前のベスト・パブリッシュ結果よりも絶対で7.6ポイント向上した。
関連論文リスト
- Contextual Distortion Reveals Constituency: Masked Language Models are
Implicit Parsers [7.558415495951758]
マスク付き言語モデル(LM)から解析木を抽出する新しい手法を提案する。
本手法は,言語摂動による文脈表現の歪みに基づいて,各スパンのスコアを算出する。
本手法は,マスク付きLMを用いた英語における従来の最先端手法を一貫して上回り,多言語環境での優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T13:10:48Z) - Hierarchical Phrase-based Sequence-to-Sequence Learning [94.10257313923478]
本稿では、学習中の帰納バイアスの源として階層的フレーズを取り入れ、推論中の明示的な制約として、標準的なシーケンス・ツー・シーケンス(seq2seq)モデルの柔軟性を維持するニューラルトランスデューサについて述べる。
本手法では,木が原文と対象句を階層的に整列するブラケット文法に基づく識別的導出法と,整列した句を1対1で翻訳するニューラルネットワークセク2セックモデルという2つのモデルを訓練する。
論文 参考訳(メタデータ) (2022-11-15T05:22:40Z) - On Parsing as Tagging [66.31276017088477]
そこで我々は,現在最先端の選挙区タグであるテトラタグを減らして,シフト-リデュース解析を行う方法を示す。
我々は、線形化器、学習者、復号器の異なる選択でタグ付けパイプラインの分類を実証的に評価する。
論文 参考訳(メタデータ) (2022-11-14T13:37:07Z) - CPTAM: Constituency Parse Tree Aggregation Method [6.011216641982612]
本稿では,異なる距離から区切り木を集約するために,真理発見の考え方を取り入れた。
本稿では,構造集約と構成ラベル集約という2つのステップで,構成構文解析木集約問題を定式化する。
さまざまな言語やドメインのベンチマークデータセットで実験が行われる。
論文 参考訳(メタデータ) (2022-01-19T23:05:37Z) - Focused Contrastive Training for Test-based Constituency Analysis [7.312581661832785]
本稿では,言語実験に基づく選挙区分析のための文法モデルの自己学習手法を提案する。
事前学習された言語モデルは、コーパスから文法文を対照的に推定し、構文テストによって摂動された非文法文を微調整する。
論文 参考訳(メタデータ) (2021-09-30T14:22:15Z) - Constructing Taxonomies from Pretrained Language Models [52.53846972667636]
本稿では,事前学習した言語モデルを用いて分類木(WordNetなど)を構築する手法を提案する。
我々のアプローチは2つのモジュールから構成されており、1つは親関係を予測し、もう1つはそれらの予測を木に調整する。
我々は、WordNetからサンプリングされたサブツリーでモデルをトレーニングし、重複しないWordNetサブツリーでテストする。
論文 参考訳(メタデータ) (2020-10-24T07:16:21Z) - Efficient Constituency Parsing by Pointing [21.395573911155495]
本稿では,解析問題を一連のポインティングタスクにキャストする新しい選挙区解析モデルを提案する。
我々のモデルは効率的なトップダウンデコーディングをサポートしており、我々の学習目的は、高価なCKY推論に頼ることなく、構造的一貫性を強制することができる。
論文 参考訳(メタデータ) (2020-06-24T08:29:09Z) - Towards Instance-Level Parser Selection for Cross-Lingual Transfer of
Dependency Parsers [59.345145623931636]
我々は、インスタンスレベルの選択(ILPS)という、新しい言語間移動パラダイムを論じる。
本稿では,デレキシライズドトランスファーの枠組みにおけるインスタンスレベルの選択に着目した概念実証研究を提案する。
論文 参考訳(メタデータ) (2020-04-16T13:18:55Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。