論文の概要: RST-style Discourse Parsing Guided by Document-level Content Structures
- arxiv url: http://arxiv.org/abs/2309.04141v1
- Date: Fri, 8 Sep 2023 05:50:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-11 15:53:27.211236
- Title: RST-style Discourse Parsing Guided by Document-level Content Structures
- Title(参考訳): 文書レベルコンテンツ構造によるrst型談話解析
- Authors: Ming Li, Ruihong Huang
- Abstract要約: 既存のRTT解析パイプラインは、文書レベルのコンテンツ構造を知らずに修辞構造を構築する。
本稿では,構造を意識したニュースコンテンツ文表現を取り入れたRTT-DPのための新しいパイプラインを提案する。
- 参考スコア(独自算出の注目度): 27.28989421841165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rhetorical Structure Theory based Discourse Parsing (RST-DP) explores how
clauses, sentences, and large text spans compose a whole discourse and presents
the rhetorical structure as a hierarchical tree. Existing RST parsing pipelines
construct rhetorical structures without the knowledge of document-level content
structures, which causes relatively low performance when predicting the
discourse relations for large text spans. Recognizing the value of high-level
content-related information in facilitating discourse relation recognition, we
propose a novel pipeline for RST-DP that incorporates structure-aware news
content sentence representations derived from the task of News Discourse
Profiling. By incorporating only a few additional layers, this enhanced
pipeline exhibits promising performance across various RST parsing metrics.
- Abstract(参考訳): RST-DP (Rhetorical Structure Theory based Discourse Parsing) は、節、文、および大きなテキストが全言を構成し、その修辞構造を階層木として示す方法を探る。
既存のRTT解析パイプラインは、文書レベルのコンテンツ構造を知らずに修辞構造を構築し、大きなテキストの談話関係を予測する際に比較的低い性能をもたらす。
談話関係認識における高レベルコンテンツ関連情報の価値を認識し,ニュース談話プロファイリングの課題から派生した構造対応ニュースコンテンツ文表現を取り入れたRTT-DPのパイプラインを提案する。
追加レイヤをわずかに追加することで、この拡張パイプラインは、さまざまなRTT解析メトリクスにわたって有望なパフォーマンスを示す。
関連論文リスト
- From Text Segmentation to Smart Chaptering: A Novel Benchmark for
Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。
また,高効率な階層分割モデルMiniSegを導入する。
論文 参考訳(メタデータ) (2024-02-27T15:59:37Z) - Document Structure in Long Document Transformers [64.76981299465885]
長い文書は、しばしばセクションヘッダーや段落のような異なる機能で階層的に整理された要素を持つ構造を示す。
文書構造の不明瞭さにもかかわらず、自然言語処理(NLP)におけるその役割はいまだに不透明である。
長期文書変換モデルは事前学習中に文書構造の内部表現を取得するか?
事前トレーニング後に構造情報をモデルに伝達するにはどうすればよいのか、下流のパフォーマンスにどのように影響するのか?
論文 参考訳(メタデータ) (2024-01-31T08:28:06Z) - Advancing Topic Segmentation and Outline Generation in Chinese Texts: The Paragraph-level Topic Representation, Corpus, and Benchmark [44.06803331843307]
段落レベルのトピック構造は、ドキュメント全体のコンテキストをより高いレベルから把握し、理解することができる。
大規模で高品質な中国語段落レベルの話題構造コーパスの欠如は研究や応用を妨げた。
コーパス構築を導くために,3層からなる階層的な段落レベルのトピック構造表現を提案する。
2段階のマンマシン・コラボレーティブ・アノテーションを用いて,中国最大規模のトピック構造コーパスを構築する。
論文 参考訳(メタデータ) (2023-05-24T06:43:23Z) - Uncovering the Potential of ChatGPT for Discourse Analysis in Dialogue:
An Empirical Study [51.079100495163736]
本稿では、トピックセグメンテーションと談話解析という2つの談話分析タスクにおけるChatGPTの性能を体系的に検証する。
ChatGPTは、一般的なドメイン間会話においてトピック構造を特定する能力を示すが、特定のドメイン間会話ではかなり困難である。
我々のより深い調査は、ChatGPTは人間のアノテーションよりも合理的なトピック構造を提供するが、階層的なレトリック構造を線形に解析することしかできないことを示唆している。
論文 参考訳(メタデータ) (2023-05-15T07:14:41Z) - DMRST: A Joint Framework for Document-Level Multilingual RST Discourse
Segmentation and Parsing [24.986030179701405]
本稿では,EDUセグメンテーションと談話木解析を共同で行う文書レベルの多言語RST談話解析フレームワークを提案する。
本モデルは,すべてのサブタスクにおいて,文書レベルの多言語RST解析における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-10-09T09:15:56Z) - RST Parsing from Scratch [14.548146390081778]
本稿では、RST(Rhetorical Structure Theory)フレームワークにおいて、文書レベルの言論解析の新しいエンドツーエンドの定式化を導入する。
本フレームワークは,会話のセグメンテーションを前提条件として必要とせず,スクラッチからの談話解析を容易にする。
我々の統合構文解析モデルでは、ビームサーチを用いて、最高の木構造を高速な木々の空間を探索することでデコードする。
論文 参考訳(メタデータ) (2021-05-23T06:19:38Z) - Substructure Substitution: Structured Data Augmentation for NLP [55.69800855705232]
SUB2は、同じラベルを持つサブ構造を置換して新しい例を生成する。
より一般的なタスクでは、選挙区解析木に基づくSUB2のバリエーションを示す。
ほとんどの場合、SUB2による強化データセットによるトレーニングは、元のトレーニングセットでのトレーニングよりも優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-01-02T09:54:24Z) - An End-to-End Document-Level Neural Discourse Parser Exploiting
Multi-Granularity Representations [24.986030179701405]
構文とセマンティクスにまたがる複数のレベルの粒度から派生した堅牢な表現を利用します。
このような表現をエンドツーエンドのエンコーダデコーダニューラルアーキテクチャに組み込んで、よりリソース豊富な対話処理を行います。
論文 参考訳(メタデータ) (2020-12-21T08:01:04Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - Summarize, Outline, and Elaborate: Long-Text Generation via Hierarchical
Supervision from Extractive Summaries [46.183289748907804]
長文生成のためのアウトライン化,アウトライン化,エラボレートを行うパイプラインシステムSOEを提案する。
SOEは、より高速な収束速度とともに、非常に優れた品質の長いテキストを生成する。
論文 参考訳(メタデータ) (2020-10-14T13:22:20Z) - A Top-Down Neural Architecture towards Text-Level Parsing of Discourse
Rhetorical Structure [27.927104697483934]
テキストレベルのDRS解析に向けたトップダウンニューラルアーキテクチャを提案する。
談話解析を分割点ランキングタスクとして用い,そのランクに応じて分割点を異なるレベルに分類する。
このようにして、内部スタックを持つエンコーダデコーダを用いて、完全なDSSを階層木構造として決定することができる。
論文 参考訳(メタデータ) (2020-05-06T09:27:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。