論文の概要: Dialogue State Tracking with a Language Model using Schema-Driven
Prompting
- arxiv url: http://arxiv.org/abs/2109.07506v1
- Date: Wed, 15 Sep 2021 18:11:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-18 09:21:52.987430
- Title: Dialogue State Tracking with a Language Model using Schema-Driven
Prompting
- Title(参考訳): スキーマ駆動プロンプトを用いた言語モデルによる対話状態追跡
- Authors: Chia-Hsuan Lee, Hao Cheng, Mari Ostendorf
- Abstract要約: 本稿では,スキーマ駆動型プロンプトを用いてタスク認識履歴エンコーディングを行う言語モデリング手法の新たなバリエーションを提案する。
我々の純生成システムは、MultiWOZ 2.2の最先端性能を実現し、MultiWOZ 2.1とM2Mの2つのベンチマークで競合性能を達成する。
- 参考スコア(独自算出の注目度): 18.83983018421701
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-oriented conversational systems often use dialogue state tracking to
represent the user's intentions, which involves filling in values of
pre-defined slots. Many approaches have been proposed, often using
task-specific architectures with special-purpose classifiers. Recently, good
results have been obtained using more general architectures based on pretrained
language models. Here, we introduce a new variation of the language modeling
approach that uses schema-driven prompting to provide task-aware history
encoding that is used for both categorical and non-categorical slots. We
further improve performance by augmenting the prompting with schema
descriptions, a naturally occurring source of in-domain knowledge. Our purely
generative system achieves state-of-the-art performance on MultiWOZ 2.2 and
achieves competitive performance on two other benchmarks: MultiWOZ 2.1 and M2M.
The data and code will be available at
https://github.com/chiahsuan156/DST-as-Prompting.
- Abstract(参考訳): タスク指向の会話システムは、しばしば、事前に定義されたスロットの値を埋めることを含むユーザの意図を表現するために、対話状態トラッキングを使用する。
多くのアプローチが提案されており、特殊目的分類器を備えたタスク固有のアーキテクチャを用いることが多い。
近年、事前学習された言語モデルに基づくより一般的なアーキテクチャを用いて良い結果が得られている。
本稿では,スキーマ駆動プロンプトを用いて,カテゴリと非カテゴリの両方のスロットに使用されるタスク認識履歴エンコーディングを提供する,言語モデリングアプローチの新たなバリエーションを紹介する。
ドメイン内知識の自然発生源であるスキーマ記述のプロンプトを増強することにより、パフォーマンスをさらに向上させる。
我々の純生成システムはMultiWOZ 2.2の最先端性能を実現し、MultiWOZ 2.1とM2Mの2つのベンチマークで競合性能を達成する。
データとコードはhttps://github.com/chiahsuan156/dst-as-promptingで入手できる。
関連論文リスト
- Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - ChatterBox: Multi-round Multimodal Referring and Grounding [108.9673313949746]
この目的のために,新しいベンチマークと効率的な視覚言語モデルを提案する。
提案したChatterBoxは、2ブランチアーキテクチャを使って視覚と言語タスクを協調的に処理する。
実験の結果、ChatterBoxはMRGの既存のモデルよりも定量的にも質的にも優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-24T09:02:00Z) - Automated Few-shot Classification with Instruction-Finetuned Language
Models [76.69064714392165]
我々は、AuT-Fewが最先端の数ショット学習方法より優れていることを示す。
AuT-Few は RAFT few-shot ベンチマークにおいて,データセット間で最高のランク付け手法であることを示す。
論文 参考訳(メタデータ) (2023-05-21T21:50:27Z) - DiSTRICT: Dialogue State Tracking with Retriever Driven In-Context
Tuning [7.5700317050237365]
対話状態追跡(DST)のための一般化可能なインコンテキストチューニング手法であるDiSTRICTを提案する。
DSTRICTは、手作りのテンプレートを使わずにモデルを微調整するために、与えられた対話のための非常に関連性の高いトレーニング例を検索する。
MultiWOZベンチマークデータセットによる実験では、DiSTRICTは、さまざまなゼロショットおよび少数ショット設定において、既存のアプローチよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-12-06T09:40:15Z) - Multi-Modal Few-Shot Object Detection with Meta-Learning-Based
Cross-Modal Prompting [77.69172089359606]
本稿では,マルチモーダルな複数ショットオブジェクト検出(FSOD)について,少数ショット視覚例とクラスセマンティック情報の両方を用いて検討する。
我々のアプローチは、(メトリックベース)メタラーニングとプロンプトベースラーニングの高レベルな概念的類似性によって動機付けられている。
提案するマルチモーダルFSODモデルを,複数の複数ショットオブジェクト検出ベンチマークで総合的に評価し,有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-16T16:45:06Z) - Show, Don't Tell: Demonstrations Outperform Descriptions for
Schema-Guided Task-Oriented Dialogue [27.43338545216015]
Show, Don't TellはSeq2seqモデリングのプロンプトフォーマットで、ショートラベル付きサンプルダイアログを使用してスキーマ要素のセマンティクスを示す。
サービス開発者からも同様の努力を必要とする一方で、大規模な言語モデルによるスキーマ表現としてショートサンプルを使用することで、パフォーマンスが向上し、一般化が向上することを示す。
論文 参考訳(メタデータ) (2022-04-08T23:27:18Z) - Description-Driven Task-Oriented Dialog Modeling [29.200221289845533]
言語記述駆動システムでは,タスク仕様の理解が向上し,状態追跡性能が向上し,データ効率が向上し,目に見えないタスクへの効率的なゼロショット転送が可能であることを示す。
本稿では、スキーマ記述と"インデックスピッキング"機構に純粋に依存した、シンプルで効果的な記述駆動型ダイアログ状態追跡(D3ST)モデルを提案する。
論文 参考訳(メタデータ) (2022-01-21T22:07:41Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - A Sequence-to-Sequence Approach to Dialogue State Tracking [17.81139775400199]
Seq2Seq-DUはシーケンス対シーケンス問題として対話状態追跡を形式化する。
インテント、スロット、スロットの値を共同でモデル化することができる。
分類スロットや非分類スロット、見えないスキーマを効果的に扱うことができる。
論文 参考訳(メタデータ) (2020-11-18T21:42:44Z) - Modelling Hierarchical Structure between Dialogue Policy and Natural
Language Generator with Option Framework for Task-oriented Dialogue System [49.39150449455407]
HDNOは、特定の対話行為表現の設計を避けるために潜在対話行為を設計するためのオプションフレームワークである。
RL,LaRL,HDSAで学習した単語レベルE2Eモデルと比較して,マルチドメイン対話のデータセットであるMultiWoz 2.0とMultiWoz 2.1でHDNOをテストする。
論文 参考訳(メタデータ) (2020-06-11T20:55:28Z) - MA-DST: Multi-Attention Based Scalable Dialog State Tracking [13.358314140896937]
ダイアログ状態追跡ダイアログは、ユーザーが目標を達成するための自然言語インターフェースを提供する。
正確なマルチドメインDSTを実現するためには、過去の発話とスロットセマンティクス間の依存関係をエンコードする必要がある。
本稿では,会話履歴とスロットの意味を符号化する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-07T05:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。