論文の概要: Dialogue Term Extraction using Transfer Learning and Topological Data
Analysis
- arxiv url: http://arxiv.org/abs/2208.10448v1
- Date: Mon, 22 Aug 2022 17:04:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 13:13:05.698429
- Title: Dialogue Term Extraction using Transfer Learning and Topological Data
Analysis
- Title(参考訳): 転送学習と位相データ解析を用いた対話語抽出
- Authors: Renato Vukovic, Michael Heck, Benjamin Matthias Ruppik, Carel van
Niekerk, Marcus Zibrowius, Milica Ga\v{s}i\'c
- Abstract要約: 我々は、純粋にデータ駆動方式で対話におけるドメイン、スロット、値の認識を可能にするさまざまな機能を探究する。
各特徴セットの有用性を検討するために、広く使われているMultiWOZデータセットに基づいてシードモデルを訓練する。
提案手法は,単語の埋め込みのみに依存する従来の手法よりも優れている。
- 参考スコア(独自算出の注目度): 0.8185867455104834
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Goal oriented dialogue systems were originally designed as a natural language
interface to a fixed data-set of entities that users might inquire about,
further described by domain, slots, and values. As we move towards adaptable
dialogue systems where knowledge about domains, slots, and values may change,
there is an increasing need to automatically extract these terms from raw
dialogues or related non-dialogue data on a large scale. In this paper, we take
an important step in this direction by exploring different features that can
enable systems to discover realizations of domains, slots, and values in
dialogues in a purely data-driven fashion. The features that we examine stem
from word embeddings, language modelling features, as well as topological
features of the word embedding space. To examine the utility of each feature
set, we train a seed model based on the widely used MultiWOZ data-set. Then, we
apply this model to a different corpus, the Schema-Guided Dialogue data-set.
Our method outperforms the previously proposed approach that relies solely on
word embeddings. We also demonstrate that each of the features is responsible
for discovering different kinds of content. We believe our results warrant
further research towards ontology induction, and continued harnessing of
topological data analysis for dialogue and natural language processing
research.
- Abstract(参考訳): 目標指向対話システムは元々、ユーザが問い合わせ、さらにドメイン、スロット、値によって記述できる固定されたエンティティのデータセットに対する自然な言語インターフェースとして設計されていた。
ドメイン、スロット、値に関する知識が変化しうる適応可能な対話システムへと進むにつれ、これらの用語を生の対話や関連する非対話データから大規模に抽出する必要性が高まっている。
本稿では,対話におけるドメイン,スロット,値の実現を,純粋にデータ駆動方式で検出できるさまざまな機能を検討することで,この方向への重要な一歩を踏み出します。
私たちが調査する機能は、単語埋め込み、言語モデリング機能、および単語埋め込み空間の位相的特徴に由来する。
各機能セットの有用性を調べるために、広く使われているマルチウォズデータセットに基づいたシードモデルをトレーニングする。
次に、このモデルを別のコーパスであるSchema-Guided Dialogueデータセットに適用する。
提案手法は, 単語埋め込みのみに依存するアプローチよりも優れている。
また、それぞれの機能が異なる種類のコンテンツを発見する責任があることも示しています。
我々は、オントロジーの誘導に向けたさらなる研究が保証され、対話や自然言語処理の研究にトポロジデータ分析の活用が継続されていると信じている。
関連論文リスト
- Bridging Information Gaps in Dialogues With Grounded Exchanges Using Knowledge Graphs [4.449835214520727]
対話的接地のための大規模言語モデルの可能性について検討する。
私たちのアプローチでは、5つの知識領域にまたがる人間の会話を注釈付けして、BridgeKGと呼ばれる対話コーパスを作成します。
本研究は,これらのモデルが会話ベースタスクや一般的な予測誤りに対して,コンテキスト内学習をどのように利用するかについての知見を提供する。
論文 参考訳(メタデータ) (2024-08-02T08:07:15Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - Building a Role Specified Open-Domain Dialogue System Leveraging
Large-Scale Language Models [15.062014096238803]
本研究では,オープンドメイン対話システムにおける役割を示唆する課題について検討する。
スクラッチからロール充足型対話データセットを構築するための効率的なデータ収集フレームワークを提案する。
当社のモデルでは,一般的なメトリクス上での競合的なパフォーマンスを維持しながら,アウトオブバウンド(out-of-bound)な発話をほとんど返さない。
論文 参考訳(メタデータ) (2022-04-30T06:23:06Z) - Structure Extraction in Task-Oriented Dialogues with Slot Clustering [94.27806592467537]
タスク指向対話では、対話構造はしばしば対話状態間の遷移グラフと見なされている。
本稿では,タスク指向対話における構造抽出のための簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-02-28T20:18:12Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Language Model as an Annotator: Exploring DialoGPT for Dialogue
Summarization [29.887562761942114]
本稿では,対話応答生成のための事前学習モデルであるDialoGPTを,教師なし対話アノテータとして開発する方法を示す。
ダイアロGPTを用いて、2つの対話要約データセット(SAMSumとAMI)に3種類の特徴をラベル付けし、事前学習モデルと非訓練モデルを用いて要約する。
論文 参考訳(メタデータ) (2021-05-26T13:50:13Z) - RiSAWOZ: A Large-Scale Multi-Domain Wizard-of-Oz Dataset with Rich
Semantic Annotations for Task-Oriented Dialogue Modeling [35.75880078666584]
RiSAWOZ は、Rich Semantic s を用いた大規模マルチドメインの Chinese Wizard-of-Oz データセットである。
11.2Kのヒューマン・ツー・ヒューマン(H2H)マルチターン・アノテート・ダイアログを含み、12ドメインにまたがる150K以上の発話がある。
論文 参考訳(メタデータ) (2020-10-17T08:18:59Z) - Meta-Context Transformers for Domain-Specific Response Generation [4.377737808397113]
本稿では,ドメイン固有属性の強化による対話応答生成のためのトランスフォーマーベースモデルDSRNetを提案する。
ドメイン固有応答生成のためのマルチターンマルチインターロケータ環境におけるDSRNetの利用について検討する。
BLEUと意味的類似性(BertScore)が向上したマルチターン対話システムに対して,本モデルでは高い精度向上を実現した。
論文 参考訳(メタデータ) (2020-10-12T09:49:27Z) - Ranking Enhanced Dialogue Generation [77.8321855074999]
対話履歴を効果的に活用する方法は、マルチターン対話生成において重要な問題である。
これまでの研究は通常、歴史をモデル化するために様々なニューラルネットワークアーキテクチャを使用していた。
本稿では,ランキング拡張対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T01:49:56Z) - Variational Hierarchical Dialog Autoencoder for Dialog State Tracking
Data Augmentation [59.174903564894954]
本研究では,この手法を,ゴール指向対話のための対話状態追跡タスクに拡張する。
目的指向ダイアログの完全な側面をモデル化するための変分階層型ダイアログオートエンコーダ(VHDA)を提案する。
各種ダイアログデータセットを用いた実験により、生成データ拡張による下流ダイアログトラッカーのロバスト性の向上が示された。
論文 参考訳(メタデータ) (2020-01-23T15:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。