論文の概要: Large Discourse Treebanks from Scalable Distant Supervision
- arxiv url: http://arxiv.org/abs/2212.06038v1
- Date: Tue, 18 Oct 2022 03:33:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-22 04:11:53.128017
- Title: Large Discourse Treebanks from Scalable Distant Supervision
- Title(参考訳): スケーラブルディスタント・スーパービジョンからの大規模ディスコースツリーバンク
- Authors: Patrick Huber and Giuseppe Carenini
- Abstract要約: 本稿では,感情分析の補助的課題に対する遠隔監視から「銀標準」談話木を生成する枠組みを提案する。
銀標準」の談話木は、より大きく、より多様性があり、ドメインに依存しないデータセットで訓練されている。
- 参考スコア(独自算出の注目度): 30.615883375573432
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Discourse parsing is an essential upstream task in Natural Language
Processing with strong implications for many real-world applications. Despite
its widely recognized role, most recent discourse parsers (and consequently
downstream tasks) still rely on small-scale human-annotated discourse
treebanks, trying to infer general-purpose discourse structures from very
limited data in a few narrow domains. To overcome this dire situation and allow
discourse parsers to be trained on larger, more diverse and domain-independent
datasets, we propose a framework to generate "silver-standard" discourse trees
from distant supervision on the auxiliary task of sentiment analysis.
- Abstract(参考訳): 談話解析は自然言語処理において必須の上流タスクであり、現実世界の多くのアプリケーションに強い影響を与える。
その役割は広く認識されているが、最近の談話パーサー(そしてそれゆえ下流のタスク)は、いくつかの狭い領域の非常に限られたデータから汎用の談話構造を推測しようと、小規模の人間の注釈付き談話木バンクに依存している。
この難易度を克服し、より大きく多様でドメインに依存しないデータセットで談話パーサを訓練できるようにするために、感情分析の補助的なタスクにおいて遠隔から「銀標準」談話木を生成する枠組みを提案する。
関連論文リスト
- Topic-driven Distant Supervision Framework for Macro-level Discourse
Parsing [72.14449502499535]
テキストの内部修辞構造を解析する作業は、自然言語処理において難しい問題である。
近年のニューラルモデルの発展にもかかわらず、トレーニングのための大規模で高品質なコーパスの欠如は大きな障害となっている。
近年の研究では、遠方の監督を用いてこの制限を克服しようと試みている。
論文 参考訳(メタデータ) (2023-05-23T07:13:51Z) - On Robustness of Prompt-based Semantic Parsing with Large Pre-trained
Language Model: An Empirical Study on Codex [48.588772371355816]
本稿では,大規模なプロンプトベース言語モデルであるコーデックスの対角的ロバスト性に関する最初の実証的研究について述べる。
この結果から, 最先端の言語モデル(SOTA)は, 慎重に構築された敵の例に対して脆弱であることが示された。
論文 参考訳(メタデータ) (2023-01-30T13:21:00Z) - Unsupervised Inference of Data-Driven Discourse Structures using a Tree
Auto-Encoder [30.615883375573432]
本稿では,木構造をタスクに依存しない,教師なしの方法で生成するための新しい手法を提案する。
提案手法は,構文解析,談話解析などの木構造的目的に適用可能である。
論文 参考訳(メタデータ) (2022-10-18T03:28:39Z) - Unsupervised Learning of Hierarchical Conversation Structure [50.29889385593043]
ゴール指向の会話は、しばしば意味のあるサブ対話構造を持つが、ドメインに依存しやすい。
この研究は、ターンやサブダイアログのセグメントラベルを含む階層的な会話構造を学習するための教師なしのアプローチを導入する。
復号化構造は3つの会話レベル理解タスクのための言語ニューラルネットワークの強化に有用であることが示されている。
論文 参考訳(メタデータ) (2022-05-24T17:52:34Z) - Predicting Above-Sentence Discourse Structure using Distant Supervision
from Topic Segmentation [8.688675709130289]
RSTスタイルの談話解析は多くのNLPタスクにおいて重要な役割を担っている。
その重要性にもかかわらず、現代の談話解析における最も一般的な制限の1つは、大規模なデータセットの欠如である。
論文 参考訳(メタデータ) (2021-12-12T10:16:45Z) - Neural Abstructions: Abstractions that Support Construction for Grounded
Language Learning [69.1137074774244]
言語の相互作用を効果的に活用するには、言語基底に対する2つの最も一般的なアプローチの制限に対処する必要がある。
本稿では,ラベル条件付き生成モデルの推論手順に対する制約のセットであるニューラル・アブストラクションの考え方を紹介する。
この手法により,マインクラフトにおけるオープンエンドハウスタスクのセマンティックな変更をユーザ人口が構築できることが示される。
論文 参考訳(メタデータ) (2021-07-20T07:01:15Z) - Randomized Deep Structured Prediction for Discourse-Level Processing [45.725437752821655]
近年,表現型テキストエンコーダがNLPモデルの中心となっている。
複雑な議論構造を含むタスク群に対して,深層構造予測と表現型ニューラルネットワークエンコーダを効率的に活用できることを示す。
論文 参考訳(メタデータ) (2021-01-25T21:49:32Z) - Unsupervised Learning of Discourse Structures using a Tree Autoencoder [8.005512864082126]
本研究では, 自動符号化目的による潜在木誘導フレームワークを拡張することにより, タスクに依存しない, 監視されていない方法で木構造を生成する新しい戦略を提案する。
提案されたアプローチは、構文解析、談話解析など、任意のツリー目的に適用することができる。
本稿では,複数の領域における自然文の一般的な木構造を推定し,様々なタスクで有望な結果を示す。
論文 参考訳(メタデータ) (2020-12-17T08:40:34Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - MEGA RST Discourse Treebanks with Structure and Nuclearity from Scalable
Distant Sentiment Supervision [30.615883375573432]
本稿では,感情アノテートされたデータセットから遠方からの監視を用いて,談話木バンクを自動的に生成する新しい手法を提案する。
提案手法は,効率的なビーム探索手法を用いて,任意の長さの文書に構造と核性を取り入れた木を生成する。
実験により、MEGA-DTツリーバンクでトレーニングされた談話が、ドメイン間パフォーマンスの有望な向上をもたらすことが示された。
論文 参考訳(メタデータ) (2020-11-05T18:22:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。