論文の概要: Unsupervised Learning of Discourse Structures using a Tree Autoencoder
- arxiv url: http://arxiv.org/abs/2012.09446v1
- Date: Thu, 17 Dec 2020 08:40:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 19:19:40.685113
- Title: Unsupervised Learning of Discourse Structures using a Tree Autoencoder
- Title(参考訳): 樹木オートエンコーダを用いた談話構造の教師なし学習
- Authors: Patrick Huber and Giuseppe Carenini
- Abstract要約: 本研究では, 自動符号化目的による潜在木誘導フレームワークを拡張することにより, タスクに依存しない, 監視されていない方法で木構造を生成する新しい戦略を提案する。
提案されたアプローチは、構文解析、談話解析など、任意のツリー目的に適用することができる。
本稿では,複数の領域における自然文の一般的な木構造を推定し,様々なタスクで有望な結果を示す。
- 参考スコア(独自算出の注目度): 8.005512864082126
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discourse information, as postulated by popular discourse theories, such as
RST and PDTB, has been shown to improve an increasing number of downstream NLP
tasks, showing positive effects and synergies of discourse with important
real-world applications. While methods for incorporating discourse become more
and more sophisticated, the growing need for robust and general discourse
structures has not been sufficiently met by current discourse parsers, usually
trained on small scale datasets in a strictly limited number of domains. This
makes the prediction for arbitrary tasks noisy and unreliable. The overall
resulting lack of high-quality, high-quantity discourse trees poses a severe
limitation to further progress. In order the alleviate this shortcoming, we
propose a new strategy to generate tree structures in a task-agnostic,
unsupervised fashion by extending a latent tree induction framework with an
auto-encoding objective. The proposed approach can be applied to any
tree-structured objective, such as syntactic parsing, discourse parsing and
others. However, due to the especially difficult annotation process to generate
discourse trees, we initially develop a method to generate larger and more
diverse discourse treebanks. In this paper we are inferring general tree
structures of natural text in multiple domains, showing promising results on a
diverse set of tasks.
- Abstract(参考訳): RSTやPDTBのような一般的な談話理論によって仮定された談話情報は、下流のNLPタスクの増加を改善し、重要な現実世界の応用と対話の肯定的な効果と相乗効果を示すことが示されている。
言論を取り入れる手法はますます洗練されていくが、強固で一般的な言論構造の必要性は、通常、厳密な数のドメインで小さなデータセットで訓練された現在の言論パーサーによって十分に満たされていない。
これにより、任意のタスクの予測がうるさいし、信頼できない。
結果として生じる、高品質で高品質な談話ツリーの欠如は、さらなる進歩に深刻な制限をもたらす。
この欠点を解消するために,潜在木誘導フレームワークを自動エンコーディング目的に拡張することにより,タスクに依存しない教師なし方式で木構造を生成する新しい手法を提案する。
提案手法は,構文解析,談話解析などの木構造的目的に適用可能である。
しかし,談話木を生成するのに特に難しいアノテーションプロセスのため,まず,より大きく多様な談話木バンクを生成する方法を開発した。
本稿では,複数の領域における自然文の一般的な木構造を推定し,様々なタスクで有望な結果を示す。
関連論文リスト
- Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - RLET: A Reinforcement Learning Based Approach for Explainable QA with
Entailment Trees [47.745218107037786]
本稿では,強化学習に基づくEntailment Tree生成フレームワークであるRLETを提案する。
RLETは文の選択と推論生成モジュールによる単一ステップ推論を反復的に行う。
EntailmentBankデータセットの3つの設定の実験では、RLフレームワークを使用することの強みが示されている。
論文 参考訳(メタデータ) (2022-10-31T06:45:05Z) - Large Discourse Treebanks from Scalable Distant Supervision [30.615883375573432]
本稿では,感情分析の補助的課題に対する遠隔監視から「銀標準」談話木を生成する枠組みを提案する。
銀標準」の談話木は、より大きく、より多様性があり、ドメインに依存しないデータセットで訓練されている。
論文 参考訳(メタデータ) (2022-10-18T03:33:43Z) - Unsupervised Inference of Data-Driven Discourse Structures using a Tree
Auto-Encoder [30.615883375573432]
本稿では,木構造をタスクに依存しない,教師なしの方法で生成するための新しい手法を提案する。
提案手法は,構文解析,談話解析などの木構造的目的に適用可能である。
論文 参考訳(メタデータ) (2022-10-18T03:28:39Z) - Incorporating Constituent Syntax for Coreference Resolution [50.71868417008133]
本稿では,構成構文構造をグラフベースで組み込む手法を提案する。
また、高次近傍情報を利用して構成木に富んだ構造をエンコードすることも検討する。
on the English and Chinese parts of OntoNotes 5.0 benchmark shows that our proposed model beats a strong baseline or a new-of-the-art performance。
論文 参考訳(メタデータ) (2022-02-22T07:40:42Z) - Predicting Above-Sentence Discourse Structure using Distant Supervision
from Topic Segmentation [8.688675709130289]
RSTスタイルの談話解析は多くのNLPタスクにおいて重要な役割を担っている。
その重要性にもかかわらず、現代の談話解析における最も一般的な制限の1つは、大規模なデータセットの欠如である。
論文 参考訳(メタデータ) (2021-12-12T10:16:45Z) - MEGA RST Discourse Treebanks with Structure and Nuclearity from Scalable
Distant Sentiment Supervision [30.615883375573432]
本稿では,感情アノテートされたデータセットから遠方からの監視を用いて,談話木バンクを自動的に生成する新しい手法を提案する。
提案手法は,効率的なビーム探索手法を用いて,任意の長さの文書に構造と核性を取り入れた木を生成する。
実験により、MEGA-DTツリーバンクでトレーニングされた談話が、ドメイン間パフォーマンスの有望な向上をもたらすことが示された。
論文 参考訳(メタデータ) (2020-11-05T18:22:38Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Exploiting Syntactic Structure for Better Language Modeling: A Syntactic
Distance Approach [78.77265671634454]
我々はマルチタスクの目的、すなわち、モデルが単語を同時に予測し、また「シンタクティック距離」と呼ばれる形態で真実解析木を解析する。
Penn Treebank と Chinese Treebank のデータセットによる実験結果から,地上の真理解析木を追加の訓練信号として提供すると,そのモデルはより低いパープレキシティを実現し,より良い品質で木を誘導できることが示された。
論文 参考訳(メタデータ) (2020-05-12T15:35:00Z) - Tree-structured Attention with Hierarchical Accumulation [103.47584968330325]
階層的累積」は解析木構造を一定時間複雑度で自己注意に符号化する。
提案手法は,4つの IWSLT 翻訳タスクと WMT'14 翻訳タスクにおいて,SOTA 法より優れている。
論文 参考訳(メタデータ) (2020-02-19T08:17:00Z) - Discontinuous Constituent Parsing with Pointer Networks [0.34376560669160383]
不連続な構成木は、ドイツ語のような言語の文法的な現象を表現するのに不可欠である。
係り受け解析の最近の進歩は、ポインタネットワークが文中の単語間の構文関係を効率的に解析することに優れていることを示している。
本稿では,最も正確な不連続な構成表現を生成するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-05T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。