論文の概要: Topic-driven Distant Supervision Framework for Macro-level Discourse
Parsing
- arxiv url: http://arxiv.org/abs/2305.13755v1
- Date: Tue, 23 May 2023 07:13:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 18:25:27.928815
- Title: Topic-driven Distant Supervision Framework for Macro-level Discourse
Parsing
- Title(参考訳): マクロレベルの談話解析のためのトピック駆動遠隔監視フレームワーク
- Authors: Feng Jiang, Longwang He, Peifeng Li, Qiaoming Zhu, Haizhou Li
- Abstract要約: テキストの内部修辞構造を解析する作業は、自然言語処理において難しい問題である。
近年のニューラルモデルの発展にもかかわらず、トレーニングのための大規模で高品質なコーパスの欠如は大きな障害となっている。
近年の研究では、遠方の監督を用いてこの制限を克服しようと試みている。
- 参考スコア(独自算出の注目度): 72.14449502499535
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discourse parsing, the task of analyzing the internal rhetorical structure of
texts, is a challenging problem in natural language processing. Despite the
recent advances in neural models, the lack of large-scale, high-quality corpora
for training remains a major obstacle. Recent studies have attempted to
overcome this limitation by using distant supervision, which utilizes results
from other NLP tasks (e.g., sentiment polarity, attention matrix, and
segmentation probability) to parse discourse trees. However, these methods do
not take into account the differences between in-domain and out-of-domain
tasks, resulting in lower performance and inability to leverage the
high-quality in-domain data for further improvement. To address these issues,
we propose a distant supervision framework that leverages the relations between
topic structure and rhetorical structure. Specifically, we propose two
distantly supervised methods, based on transfer learning and the
teacher-student model, that narrow the gap between in-domain and out-of-domain
tasks through label mapping and oracle annotation. Experimental results on the
MCDTB and RST-DT datasets show that our methods achieve the best performance in
both distant-supervised and supervised scenarios.
- Abstract(参考訳): テキストの内部修辞構造を解析するタスクである談話構文解析は、自然言語処理において難しい問題である。
近年の神経モデルの進歩にもかかわらず、大規模で高品質なトレーニング用コーパスの欠如は依然として大きな障害となっている。
最近の研究では、他のnlpタスク(感情極性、注意行列、セグメンテーション確率など)の結果を利用して談話木を解析することにより、この制限を克服しようと試みている。
しかし、これらの手法はドメイン内タスクとドメイン外タスクの違いを考慮していないため、パフォーマンスが低下し、ドメイン内データの品質が向上しない。
これらの課題に対処するために,トピック構造と修辞構造の関係を利用した遠隔監視フレームワークを提案する。
具体的には,ラベルマッピングとoracleのアノテーションによってドメイン内タスクとドメイン外タスクのギャップを狭める,転送学習と教師・学生モデルに基づく2つの遠隔指導手法を提案する。
MCDTB と RST-DT のデータセットを用いた実験結果から,本手法は遠隔教師付きシナリオと教師付きシナリオの両方において最高の性能を発揮することが示された。
関連論文リスト
- Sequential Visual and Semantic Consistency for Semi-supervised Text
Recognition [56.968108142307976]
Scene Text Recognition (STR) は、大規模なアノテートデータを必要とする課題である。
既存のSTR法の多くは、STRモデルの性能を低下させ、ドメイン差を生じさせる合成データに頼っている。
本稿では,視覚的・意味的両面から単語レベルの整合性正則化を取り入れたSTRの半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-24T13:00:54Z) - Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - Syntax-Guided Domain Adaptation for Aspect-based Sentiment Analysis [23.883810236153757]
ドメイン適応は、ドメイン間で共通の知識を伝達することによって、新しいドメインにおけるデータ不足問題を緩和するための一般的なソリューションである。
より効果的なクロスドメインABSAのための、SDAMと呼ばれる新しい構文誘導型ドメイン適応モデルを提案する。
我々のモデルは、クロスドメインEnd2EndABSAタスクのMicro-F1メトリックに関して、最先端のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2022-11-10T10:09:33Z) - Towards Domain-Independent Supervised Discourse Parsing Through Gradient
Boosting [30.615883375573432]
本稿では、談話解析におけるドメイン適応問題に直接対処する新しい、教師付きパラダイムを提案する。
具体的には、弱勾配分類器の段階モデルを用いて、ドメイン依存性を緩和するために設計された最初の完全教師付き談話フレームワークを紹介する。
論文 参考訳(メタデータ) (2022-10-18T03:44:27Z) - Feature Representation Learning for Unsupervised Cross-domain Image
Retrieval [73.3152060987961]
現在の教師付きクロスドメイン画像検索法は優れた性能が得られる。
データ収集とラベリングのコストは、実際のアプリケーションにおける実践的なデプロイにおいて、難易度の高い障壁を課します。
本稿では,クラス意味認識機能抽出を支援するために,クラスタ単位のコントラスト学習機構を提案する。
論文 参考訳(メタデータ) (2022-07-20T07:52:14Z) - Predicting Above-Sentence Discourse Structure using Distant Supervision
from Topic Segmentation [8.688675709130289]
RSTスタイルの談話解析は多くのNLPタスクにおいて重要な役割を担っている。
その重要性にもかかわらず、現代の談話解析における最も一般的な制限の1つは、大規模なデータセットの欠如である。
論文 参考訳(メタデータ) (2021-12-12T10:16:45Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Cross-domain Imitation from Observations [50.669343548588294]
模擬学習は、専門家の行動を利用して訓練エージェントに適切な報酬関数を設計することの難しさを回避しようとする。
本稿では,専門家とエージェントMDPの相違点が存在する場合に,タスクを模倣する方法の問題について検討する。
このようなドメイン間の対応を学習するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-20T21:08:25Z) - Learning a Domain-Agnostic Visual Representation for Autonomous Driving
via Contrastive Loss [25.798361683744684]
ドメイン認識コントラスト学習(Domain-Agnostic Contrastive Learning、DACL)は、2段階の非監視ドメイン適応フレームワークである。
提案手法は,従来の最新手法に比べ,単眼深度推定作業における性能向上を実現した。
論文 参考訳(メタデータ) (2021-03-10T07:06:03Z) - Coupling Distant Annotation and Adversarial Training for Cross-Domain
Chinese Word Segmentation [40.27961925319402]
本論文は,中国語の単語セグメント化のための遠隔アノテーションと逆行訓練を併用することを提案する。
遠隔アノテーションのために、ターゲットドメインからの監視や事前定義された辞書を必要としない自動遠隔アノテーション機構を設計する。
逆行訓練では、音源領域情報の雑音低減と最大限の活用を行うための文レベルの訓練手法を開発する。
論文 参考訳(メタデータ) (2020-07-16T08:54:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。