論文の概要: A Joint Model for Dropped Pronoun Recovery and Conversational Discourse
Parsing in Chinese Conversational Speech
- arxiv url: http://arxiv.org/abs/2106.03345v1
- Date: Mon, 7 Jun 2021 05:22:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:15:21.208799
- Title: A Joint Model for Dropped Pronoun Recovery and Conversational Discourse
Parsing in Chinese Conversational Speech
- Title(参考訳): 中国語会話音声における失語代名詞回復と会話談話解析の合同モデル
- Authors: Jingxuan Yang, Kerui Xu, Jun Xu, Si Li, Sheng Gao, Jun Guo, Nianwen
Xue and Ji-Rong Wen
- Abstract要約: 中国語会話音声におけるDPRと会話談話解析のためのニューラルモデルを提案する。
我々はDPRとCDPが密接に関連していることを示し、共同モデルが両方のタスクに有効であることを示す。
- 参考スコア(独自算出の注目度): 35.04744880857275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a neural model for joint dropped pronoun recovery
(DPR) and conversational discourse parsing (CDP) in Chinese conversational
speech. We show that DPR and CDP are closely related, and a joint model
benefits both tasks. We refer to our model as DiscProReco, and it first encodes
the tokens in each utterance in a conversation with a directed Graph
Convolutional Network (GCN). The token states for an utterance are then
aggregated to produce a single state for each utterance. The utterance states
are then fed into a biaffine classifier to construct a conversational discourse
graph. A second (multi-relational) GCN is then applied to the utterance states
to produce a discourse relation-augmented representation for the utterances,
which are then fused together with token states in each utterance as input to a
dropped pronoun recovery layer. The joint model is trained and evaluated on a
new Structure Parsing-enhanced Dropped Pronoun Recovery (SPDPR) dataset that we
annotated with both two types of information. Experimental results on the SPDPR
dataset and other benchmarks show that DiscProReco significantly outperforms
the state-of-the-art baselines of both tasks.
- Abstract(参考訳): 本稿では,中国語会話音声における対話的代名詞回復(dpr)と会話的談話解析(cdp)のニューラルモデルを提案する。
dprとcdpは密接な関係にあり,ジョイントモデルが両者に有益であることを示す。
当社のモデルをDisdisProRecoと呼び、まず最初に、有向グラフ畳み込みネットワーク(GCN)との対話において、各発話中のトークンを符号化する。
発話のトークン状態は集約され、各発話に対して単一の状態を生成する。
発話状態は、会話的談話グラフを構築するためにバイアフィン分類器に供給される。
次に、第2(多重関係)GCNを発話状態に適用し、発話に対する談話関係拡張表現を生成し、その後、ドロップした代名詞回復層への入力として各発話におけるトークン状態と融合する。
共同モデルは,2種類の情報を付加したSPDPR(Structure Parsing-enhanced Dropped Pronoun Recovery)データセットを用いて訓練および評価を行った。
SPDPRデータセットと他のベンチマークの実験結果から、Dis DiscProRecoは両方のタスクの最先端ベースラインを大きく上回っている。
関連論文リスト
- TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - Toward Joint Language Modeling for Speech Units and Text [89.32163954508489]
音声単位とテキストの共用言語モデリングについて検討する。
音声とテキストの混在度を評価するための自動計測手法を提案する。
提案手法を用いて音声単位とテキストを混合することにより,SLUタスクにおける音声のみのベースラインを改良することを示す。
論文 参考訳(メタデータ) (2023-10-12T20:53:39Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - A Speaker-aware Parallel Hierarchical Attentive Encoder-Decoder Model
for Multi-turn Dialogue Generation [13.820298189734686]
本稿では,マルチターン会話における話者の区別を強調するオープンドメイン対話生成モデルを提案する。
実験の結果,PHAEDは自動評価と人的評価の両面で最先端の成績を示した。
論文 参考訳(メタデータ) (2021-10-13T16:08:29Z) - Discourse Parsing of Contentious, Non-Convergent Online Discussions [0.16311150636417257]
対話論のバフティニア理論に着想を得て,新しい理論と計算の枠組みを提案する。
我々は,分散戦略の階層を反映する新しい談話アノテーションスキーマを開発した。
議論のないオンライン議論の最初のラベル付きデータセットを共有します。
論文 参考訳(メタデータ) (2020-12-08T17:36:39Z) - Dialogue Discourse-Aware Graph Convolutional Networks for Abstractive
Meeting Summarization [24.646506847760822]
会議要約のための対話談-Aware Graph Convolutional Networks (DDA-GCN) を開発する。
まず,対話談話関係を用いた会議テキスト全体を談話グラフに変換し,それからDDA-GCNを用いてそのグラフの意味表現を符号化する。
最後に,再帰的ニューラルネットワークを用いて要約を生成する。
論文 参考訳(メタデータ) (2020-12-07T07:51:38Z) - Filling the Gap of Utterance-aware and Speaker-aware Representation for
Multi-turn Dialogue [76.88174667929665]
マルチターン対話は、2つ以上の異なる話者の役割から複数の発話からなる。
既存の検索に基づくマルチターン対話モデルでは、事前訓練された言語モデル(PrLM)をエンコーダとして、対話を粗く表現する。
本稿では,対話履歴に係わる効果的な発話認識表現と話者認識表現をモデル化することにより,そのようなギャップを埋める新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-09-14T15:07:19Z) - An Effective Contextual Language Modeling Framework for Speech
Summarization with Augmented Features [13.97006782398121]
変換器による双方向表現(BERT)モデルが提案され,多くの自然言語処理タスクにおいて記録破りの成功を収めた。
本研究では,不完全な自動音声認識によるネガティブな影響を軽減するために,信頼度スコアを文表現に組み込むことを検討した。
提案手法の有効性をベンチマークデータセットで検証する。
論文 参考訳(メタデータ) (2020-06-01T18:27:48Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。