論文の概要: Contextual Semantic Parsing for Multilingual Task-Oriented Dialogues
- arxiv url: http://arxiv.org/abs/2111.02574v1
- Date: Thu, 4 Nov 2021 01:08:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-05 12:39:00.806253
- Title: Contextual Semantic Parsing for Multilingual Task-Oriented Dialogues
- Title(参考訳): 多言語タスク指向対話における文脈意味解析
- Authors: Mehrad Moradshahi, Victoria Tsai, Giovanni Campagna, Monica S. Lam
- Abstract要約: 1つの言語で大規模な対話データセットをセットすると、機械翻訳を用いて他の言語に対して効果的な意味を自動生成できる。
本稿では、スロット値の忠実な翻訳を保証するために、アライメント付き対話データセットの自動翻訳を提案する。
簡潔な表現が翻訳誤りの複合効果を減少させることを示す。
- 参考スコア(独自算出の注目度): 7.8378818005171125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust state tracking for task-oriented dialogue systems currently remains
restricted to a few popular languages. This paper shows that given a
large-scale dialogue data set in one language, we can automatically produce an
effective semantic parser for other languages using machine translation. We
propose automatic translation of dialogue datasets with alignment to ensure
faithful translation of slot values and eliminate costly human supervision used
in previous benchmarks. We also propose a new contextual semantic parsing
model, which encodes the formal slots and values, and only the last agent and
user utterances. We show that the succinct representation reduces the
compounding effect of translation errors, without harming the accuracy in
practice.
We evaluate our approach on several dialogue state tracking benchmarks. On
RiSAWOZ, CrossWOZ, CrossWOZ-EN, and MultiWOZ-ZH datasets we improve the state
of the art by 11%, 17%, 20%, and 0.3% in joint goal accuracy. We present a
comprehensive error analysis for all three datasets showing erroneous
annotations can obscure judgments on the quality of the model.
Finally, we present RiSAWOZ English and German datasets, created using our
translation methodology. On these datasets, accuracy is within 11% of the
original showing that high-accuracy multilingual dialogue datasets are possible
without relying on expensive human annotations.
- Abstract(参考訳): タスク指向対話システムのロバストな状態追跡は現在、いくつかの人気のある言語に制限されている。
本稿では,ある言語に大規模な対話データセットをセットすれば,機械翻訳を用いて,他の言語に対する効果的な意味解析を自動生成できることを示す。
本稿では,スロット値の忠実な変換を保証し,以前のベンチマークで用いられたコストのかかる人間の監督を解消するために,対話データセットの自動翻訳をアライメントで提案する。
また,形式的スロットと値,最後のエージェントとユーザの発話のみをエンコードする,新しい文脈意味構文解析モデルを提案する。
簡潔な表現は,実際の精度を損なうことなく,翻訳誤りの複合効果を低下させることを示す。
いくつかの対話状態追跡ベンチマークに対するアプローチを評価する。
RiSAWOZ、CrossWOZ-EN、MultiWOZ-ZHデータセットでは、共同目標の精度が11%、17%、20%、0.3%向上している。
誤ったアノテーションを示す3つのデータセットの総合的誤り解析を行い、モデルの品質を不明瞭に判断する。
最後に、翻訳手法を用いて作成した英語とドイツ語のデータセットを提示する。
これらのデータセットでは、高い人間のアノテーションに頼ることなく、高精度な多言語対話データセットが可能であることを示す。
関連論文リスト
- Zero and Few-Shot Localization of Task-Oriented Dialogue Agents with a
Distilled Representation [5.551814548069404]
本稿では,高品質な対話エージェントを構築するために,ソース言語でToDトレーニングデータを使用する自動手法を提案する。
提案手法は,TODエージェントの複数ショットと既存のフルショットの精度ギャップを埋めるものである。
論文 参考訳(メタデータ) (2023-02-18T21:30:36Z) - Weakly Supervised Data Augmentation Through Prompting for Dialogue
Understanding [103.94325597273316]
本稿では,弱教師付きフィルタを適用して拡張品質を反復する手法を提案する。
我々は、デイリーダイアログにおける感情と行動の分類タスクと、Facebook Multilingual Task-Oriented Dialogueにおける意図の分類タスクについて評価した。
特にDailyDialogでは、真理データの10%を使用して、100%のデータを使用する現在の最先端モデルよりも優れています。
論文 参考訳(メタデータ) (2022-10-25T17:01:30Z) - OneAligner: Zero-shot Cross-lingual Transfer with One Rich-Resource
Language Pair for Low-Resource Sentence Retrieval [91.76575626229824]
文検索タスク用に特別に設計されたアライメントモデルであるOneAlignerを提案する。
大規模並列多言語コーパス(OPUS-100)の全ての言語ペアで訓練すると、このモデルは最先端の結果が得られる。
実験結果から,文アライメントタスクの性能はモノリンガルおよび並列データサイズに大きく依存することがわかった。
論文 参考訳(メタデータ) (2022-05-17T19:52:42Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Cross-lingual Intermediate Fine-tuning improves Dialogue State Tracking [84.50302759362698]
我々は、事前訓練された多言語モデルの中間微調整により、伝達学習プロセスを強化する。
我々は、パラレルおよび会話型の映画字幕データセットを使用して、言語間中間タスクを設計する。
パラレルなMultiWoZデータセットとMultilingual WoZデータセットの精度を20%向上させる。
論文 参考訳(メタデータ) (2021-09-28T11:22:38Z) - Improving Multilingual Translation by Representation and Gradient
Regularization [82.42760103045083]
表現レベルと勾配レベルの両方でNMTモデルを正規化するための共同手法を提案する。
提案手法は,オフターゲット翻訳の発生率の低減とゼロショット翻訳性能の向上に有効であることを示す。
論文 参考訳(メタデータ) (2021-09-10T10:52:21Z) - Zero-Shot Cross-lingual Semantic Parsing [56.95036511882921]
7つのテスト言語に対する並列データを持たないゼロショット問題として,言語間セマンティックパーシングについて検討した。
英文論理形式ペアデータのみを用いて解析知識を付加言語に転送するマルチタスクエンコーダデコーダモデルを提案する。
このシステムは、ゼロショット解析を潜時空間アライメント問題としてフレーム化し、事前訓練されたモデルを改善し、最小のクロスリンガル転送ペナルティで論理形式を生成することができる。
論文 参考訳(メタデータ) (2021-04-15T16:08:43Z) - Auto Correcting in the Process of Translation -- Multi-task Learning
Improves Dialogue Machine Translation [31.247920419523066]
対話コーパスを深く分析し,対話翻訳における3つの主要な課題を要約する。
本稿では,欠落と型を識別し,文脈を利用して対話発話を翻訳する共同学習手法を提案する。
提案手法は,ベースライン上での3.2BLEUの翻訳品質を向上することを示す。
論文 参考訳(メタデータ) (2021-03-30T09:12:47Z) - A Few-Shot Semantic Parser for Wizard-of-Oz Dialogues with the Precise
ThingTalk Representation [5.56536459714557]
ウィザード・オブ・オズ(WOZ)会話のための効果的な意味論を構築しようとする以前の試みは、高品質で手動の注釈付きトレーニングセットを取得するのが困難であった。
本稿では,WOZ会話における正確な対話状態を予測できる新しい対話表現とサンプル効率の手法を提案する。
論文 参考訳(メタデータ) (2020-09-16T22:52:46Z) - MTOP: A Comprehensive Multilingual Task-Oriented Semantic Parsing
Benchmark [31.91964553419665]
我々はMTOPと呼ばれる新しい多言語データセットを提案し、11ドメインの6言語で100kの注釈付き発話を合成する。
既存の2つの多言語データセットに対して、Slot F1上の+6.3ポイントの平均的な改善を、実験で報告された最良の結果よりも達成する。
本稿では,事前学習モデルと自動翻訳とアライメントを組み合わせたゼロショット性能と,スロットラベル投影におけるノイズ低減のための遠隔監視手法を提案する。
論文 参考訳(メタデータ) (2020-08-21T07:02:11Z) - MultiWOZ 2.2 : A Dialogue Dataset with Additional Annotation Corrections
and State Tracking Baselines [15.540213987132839]
この作業では、MultiWOZ 2.2が導入された。
まず,MultiWOZ 2.1上での発話の17.3%にわたって,対話状態のアノテーションエラーを特定し,修正する。
第二に、多くの可能な値でスロットの語彙を再定義する。
論文 参考訳(メタデータ) (2020-07-10T22:52:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。