論文の概要: Dial2vec: Self-Guided Contrastive Learning of Unsupervised Dialogue
Embeddings
- arxiv url: http://arxiv.org/abs/2210.15332v1
- Date: Thu, 27 Oct 2022 11:14:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 12:43:57.963505
- Title: Dial2vec: Self-Guided Contrastive Learning of Unsupervised Dialogue
Embeddings
- Title(参考訳): Dial2vec: 教師なし対話埋め込みの自己指導型コントラスト学習
- Authors: Che Liu, Rui Wang, Junfeng Jiang, Yongbin Li, Fei Huang
- Abstract要約: 教師なし対話の埋め込みを学習するタスクについて紹介する。
事前学習された単語や文の埋め込みや、事前学習された言語モデルによるエンコーディングといったトライアル的なアプローチは、実現可能であることが示されている。
本稿では,Dial2vecという自己指導型コントラスト学習手法を提案する。
- 参考スコア(独自算出の注目度): 41.79937481022846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce the task of learning unsupervised dialogue
embeddings. Trivial approaches such as combining pre-trained word or sentence
embeddings and encoding through pre-trained language models (PLMs) have been
shown to be feasible for this task. However, these approaches typically ignore
the conversational interactions between interlocutors, resulting in poor
performance. To address this issue, we proposed a self-guided contrastive
learning approach named dial2vec. Dial2vec considers a dialogue as an
information exchange process. It captures the conversational interaction
patterns between interlocutors and leverages them to guide the learning of the
embeddings corresponding to each interlocutor. The dialogue embedding is
obtained by an aggregation of the embeddings from all interlocutors. To verify
our approach, we establish a comprehensive benchmark consisting of six
widely-used dialogue datasets. We consider three evaluation tasks: domain
categorization, semantic relatedness, and dialogue retrieval. Dial2vec achieves
on average 8.7, 9.0, and 13.8 points absolute improvements in terms of purity,
Spearman's correlation, and mean average precision (MAP) over the strongest
baseline on the three tasks respectively. Further analysis shows that dial2vec
obtains informative and discriminative embeddings for both interlocutors under
the guidance of the conversational interactions and achieves the best
performance when aggregating them through the interlocutor-level pooling
strategy. All codes and data are publicly available at
https://github.com/AlibabaResearch/DAMO-ConvAI/tree/main/dial2vec.
- Abstract(参考訳): 本稿では,教師なしの対話埋め込みを学習するタスクについて述べる。
プリトレーニングされた単語や文の埋め込み、プリトレーニングされた言語モデル(plm)によるエンコーディングを組み合わせるといった簡単なアプローチが、このタスクに実現可能であることが示されている。
しかし、これらのアプローチは一般的に対話者間の会話のやりとりを無視し、結果としてパフォーマンスが低下する。
この問題に対処するため,我々はDial2vecという自己指導型コントラスト学習手法を提案した。
Dial2vecは対話を情報交換プロセスとみなしている。
インターロケータ間の会話の相互作用パターンをキャプチャし、それらを利用して各インターロケータに対応する埋め込みの学習をガイドする。
対話埋め込みは、すべての対話者からの埋め込みの集約によって得られる。
提案手法を検証するために,6つの対話データセットからなる総合ベンチマークを構築した。
ドメイン分類,意味的関連性,対話検索の3つの評価課題を検討した。
Dial2vecは、平均8.7、9.0、13.8ポイントで、純度、スピアマンの相関、平均平均精度(MAP)をそれぞれ3つのタスクで最強のベースラインに対して絶対的に改善する。
さらなる分析により、diard2vecは対話的相互作用の指導のもと、双方の対話者に対して情報的および識別的埋め込みを取得し、対話者レベルのプーリング戦略を通じてそれらを集約する際に最高のパフォーマンスを達成することが示されている。
すべてのコードとデータはhttps://github.com/AlibabaResearch/DAMO-ConvAI/tree/main/dial2vecで公開されている。
関連論文リスト
- An Unsupervised Dialogue Topic Segmentation Model Based on Utterance Rewriting [3.5399864027190366]
本研究では,Utterance Rewriting(UR)技術と教師なし学習アルゴリズムを組み合わせた,教師なし対話トピックセグメンテーション手法を提案する。
The proposed Discourse Rewriting Topic Model (UR-DTS) is significantly improves the accuracy of topic segmentation。
論文 参考訳(メタデータ) (2024-09-12T00:27:31Z) - Learning to Memorize Entailment and Discourse Relations for
Persona-Consistent Dialogues [8.652711997920463]
既存の作業は、高度ネットワーク構造を持つ対話者ペルソナを意図的に学習することで、対話システムの性能を改善した。
本研究は,ペルソナ一貫性のある対話課題における係り受け関係と談話関係を記憶する学習方法を提案する。
論文 参考訳(メタデータ) (2023-01-12T08:37:00Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - DialogueCSE: Dialogue-based Contrastive Learning of Sentence Embeddings [33.89889949577356]
本稿では,対話型コントラスト学習手法であるDialogueCSEを提案する。
我々は,Microsoft Dialogue Corpus,Jing Dong Dialogue Corpus,E-Commerce Dialogue Corpusの3つの多ターン対話データセットについて評価を行った。
論文 参考訳(メタデータ) (2021-09-26T13:25:41Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - DCR-Net: A Deep Co-Interactive Relation Network for Joint Dialog Act
Recognition and Sentiment Classification [77.59549450705384]
ダイアログシステムでは、ダイアログアクト認識と感情分類は2つの相関タスクである。
既存のシステムのほとんどは、それらを別々のタスクとして扱うか、単に2つのタスクを一緒にモデル化するだけです。
本稿では,2つのタスク間の相互作用をモデル化するディープ・コ・インタラクティブ・リレーショナル・ネットワーク(DCR-Net)を提案する。
論文 参考訳(メタデータ) (2020-08-16T14:13:32Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z) - Matching Questions and Answers in Dialogues from Online Forums [12.64602629459043]
会話における2つのターン間の質問・回答関係のマッチングは、対話構造を解析する最初のステップであるだけでなく、対話システムの訓練にも有用である。
本稿では、相互注意という2つの同時注意機構により、距離情報と対話履歴の両方を考慮したQAマッチングモデルを提案する。
論文 参考訳(メタデータ) (2020-05-19T08:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。