論文の概要: Resource Constrained Dialog Policy Learning via Differentiable Inductive
Logic Programming
- arxiv url: http://arxiv.org/abs/2011.05457v1
- Date: Tue, 10 Nov 2020 23:28:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 06:28:46.222173
- Title: Resource Constrained Dialog Policy Learning via Differentiable Inductive
Logic Programming
- Title(参考訳): 微分帰納論理プログラミングによる資源制約付き対話政策学習
- Authors: Zhenpeng Zhou, Ahmad Beirami, Paul Crook, Pararth Shah, Rajen Subba,
and Alborz Geramifard
- Abstract要約: 微分帰納論理(DILOG)によるダイアログポリシーを導入する。
我々は、SimDialデータセット上でDILOGをトレーニングし、99以上のドメイン内テスト精度を得る。
調査をMultiWoZデータセットに拡張し、90%以上のインフォメーションと成功の指標を達成しました。
- 参考スコア(独自算出の注目度): 16.299431969075236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the needs of resource constrained dialog policy learning, we
introduce dialog policy via differentiable inductive logic (DILOG). We explore
the tasks of one-shot learning and zero-shot domain transfer with DILOG on
SimDial and MultiWoZ. Using a single representative dialog from the restaurant
domain, we train DILOG on the SimDial dataset and obtain 99+% in-domain test
accuracy. We also show that the trained DILOG zero-shot transfers to all other
domains with 99+% accuracy, proving the suitability of DILOG to slot-filling
dialogs. We further extend our study to the MultiWoZ dataset achieving 90+%
inform and success metrics. We also observe that these metrics are not
capturing some of the shortcomings of DILOG in terms of false positives,
prompting us to measure an auxiliary Action F1 score. We show that DILOG is
100x more data efficient than state-of-the-art neural approaches on MultiWoZ
while achieving similar performance metrics. We conclude with a discussion on
the strengths and weaknesses of DILOG.
- Abstract(参考訳): リソース制約付きダイアログポリシー学習の必要性に動機づけられ,微分可能帰納論理(dilog)によるダイアログポリシーを導入する。
我々は,simdial と multiwoz 上の dilog を用いて,ワンショット学習とゼロショットドメイン転送のタスクを検討する。
レストランドメインの1つの代表ダイアログを使用して、シムディアルデータセットでダイアログをトレーニングし、99+%のドメイン内テスト精度を得る。
また、訓練されたDILOGゼロショットは99%以上の精度で他のすべてのドメインに転送され、スロット充足ダイアログに対するDILOGの適合性が証明された。
さらに,本研究をマルチウォズデータセットに拡張し,90+%のインフォメーションとサクセスメトリックを実現する。
また,これらの指標は偽陽性という観点からはDILOGの欠点を捉えていないため,補助的行動F1スコアを測定する必要がある。
この結果から,DILOGはMultiWoZの最先端ニューラルネットワークに比べて100倍のデータ効率が向上し,類似のパフォーマンス指標が得られた。
本稿では,DILOGの強みと弱みについて論じる。
関連論文リスト
- ChatZero:Zero-shot Cross-Lingual Dialogue Generation via Pseudo-Target Language [53.8622516025736]
そこで本研究では,言語間符号切替方式に基づく,エンドツーエンドのゼロショット対話生成モデルChatZeroを提案する。
多言語DailyDialogとDSTC7-AVSDデータセットの実験は、ChatZeroが元のパフォーマンスの90%以上を達成することを示した。
論文 参考訳(メタデータ) (2024-08-16T13:11:53Z) - DialCLIP: Empowering CLIP as Multi-Modal Dialog Retriever [83.33209603041013]
マルチモーダルダイアログ検索のためのパラメータ効率の高いプロンプトチューニング手法であるDialCLIPを提案する。
提案手法では,事前学習された視覚言語モデルCLIP内のプロンプトに抽出された文脈特徴を学習するためのマルチモーダルコンテキスト生成手法を提案する。
様々なタイプの検索を容易にするために,CLIP出力からマルチモーダル表現空間へのマッピングを学習するために,複数の専門家を設計する。
論文 参考訳(メタデータ) (2024-01-02T07:40:12Z) - Gated Mechanism Enhanced Multi-Task Learning for Dialog Routing [28.870359916550996]
ゲート機構強化マルチタスクモデル(G3M)
提案では、新しいダイアログエンコーダと、2つの調整されたゲート機構モジュールを提案する。
実世界のアプリケーションから収集した2つのデータセットに基づいて,本手法の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2023-04-07T16:51:46Z) - Zero-Shot Generalizable End-to-End Task-Oriented Dialog System using
Context Summarization and Domain Schema [2.7178968279054936]
タスク指向対話システムにおける最先端のアプローチは、条件付きシーケンス生成タスクとして問題を定式化する。
これは、新しいドメインまたはタスクごとにラベル付きトレーニングデータを必要とする。
本稿では,ZS-ToDという,Zero-Shotの汎用的なエンドツーエンドタスク指向ダイアログシステムについて紹介する。
論文 参考訳(メタデータ) (2023-03-28T18:56:31Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - GRASP: Guiding model with RelAtional Semantics using Prompt [3.1275060062551208]
本稿では Prompt (GRASP) を用いたRelAtional Semantics を用いた誘導モデルを提案する。
我々は、プロンプトベースの微調整アプローチを採用し、引数を意識したプロンプトマーカー戦略を用いて、ある対話における関係意味的手がかりをキャプチャする。
実験では、DialogREデータセット上でのF1とF1cのスコアの観点から、GRASPの最先端のパフォーマンスが評価された。
論文 参考訳(メタデータ) (2022-08-26T08:19:28Z) - MultiMatch: Multi-task Learning for Semi-supervised Domain Generalization [55.06956781674986]
我々は、各ソースドメインにいくつかのラベル情報がある半教師付きドメイン一般化タスクの解決に頼っている。
我々は、MultiMatchを提案し、FixMatchをマルチタスク学習フレームワークに拡張し、SSDGのための高品質な擬似ラベルを生成する。
提案手法の有効性を検証し,いくつかのベンチマークDGデータセット上で既存の半教師付き手法とSSDG法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T14:44:33Z) - Schema-Guided Paradigm for Zero-Shot Dialog [9.822870889029115]
本稿では,STARコーパスのアテンションモデル(SAM)とスキーマ表現の改善について紹介する。
SAMはゼロショット設定が大幅に改善され、前の作業よりも+22のF1スコアが向上した。
その結果, ダイアログにおけるゼロショット一般化の可能性が検証された。
論文 参考訳(メタデータ) (2021-06-13T17:44:45Z) - Learning Dialog Policies from Weak Demonstrations [32.149932955715705]
Demonstrations (DQfD) からの深層Q-learningを構築し,ダイアログデータを利用してエージェントを誘導し,ユーザの要求に応答する。
ラベル付きデータ、ラベル付きデータ、さらにはラベルなしデータを使って、必要なデータに関する仮定を徐々に減らします。
挑戦的なマルチドメインダイアログシステムフレームワークの実験は、我々のアプローチを検証し、ドメイン外のデータでトレーニングしても高い成功率を得る。
論文 参考訳(メタデータ) (2020-04-23T10:22:16Z) - Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog [70.79442700890843]
本稿では,対象ドメインと各ドメインの関連性を自動的に活用する新しい動的核融合ネットワーク(DF-Net)を提案する。
トレーニングデータが少ないと、平均13.9%の事前最良モデルを上回り、転送可能性を示す。
論文 参考訳(メタデータ) (2020-04-23T08:17:22Z) - Differentiable Reasoning over a Virtual Knowledge Base [156.94984221342716]
コーパスを仮想知識ベース(KB)として,複雑なマルチホップ質問に答えるタスクについて検討する。
特に、コーパス内のエンティティの参照間の関係の経路をソフトに追従し、KBのようにテキストデータをトラバースするDrKITについて述べる。
DrKITは非常に効率的で、既存のマルチホップシステムよりも毎秒10-100倍のクエリを処理する。
論文 参考訳(メタデータ) (2020-02-25T03:13:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。