論文の概要: MISCA: A Joint Model for Multiple Intent Detection and Slot Filling with
Intent-Slot Co-Attention
- arxiv url: http://arxiv.org/abs/2312.05741v1
- Date: Sun, 10 Dec 2023 03:38:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 19:03:18.198003
- Title: MISCA: A Joint Model for Multiple Intent Detection and Slot Filling with
Intent-Slot Co-Attention
- Title(参考訳): misca:マルチインテント検出とスロット充填のためのインテント・スロット協調モデル
- Authors: Thinh Pham and Chi Tran and Dat Quoc Nguyen
- Abstract要約: グラフに基づくジョイントモデルである最近の高度なアプローチは、まだ2つの潜在的な問題に直面している。
我々はMISCAというジョイントモデルを提案する。
我々のMISCAは、意図-スロットのコアテンション機構とラベルアテンション機構の基盤層を導入している。
- 参考スコア(独自算出の注目度): 9.414164374919029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The research study of detecting multiple intents and filling slots is
becoming more popular because of its relevance to complicated real-world
situations. Recent advanced approaches, which are joint models based on graphs,
might still face two potential issues: (i) the uncertainty introduced by
constructing graphs based on preliminary intents and slots, which may transfer
intent-slot correlation information to incorrect label node destinations, and
(ii) direct incorporation of multiple intent labels for each token w.r.t.
token-level intent voting might potentially lead to incorrect slot predictions,
thereby hurting the overall performance. To address these two issues, we
propose a joint model named MISCA. Our MISCA introduces an intent-slot
co-attention mechanism and an underlying layer of label attention mechanism.
These mechanisms enable MISCA to effectively capture correlations between
intents and slot labels, eliminating the need for graph construction. They also
facilitate the transfer of correlation information in both directions: from
intents to slots and from slots to intents, through multiple levels of
label-specific representations, without relying on token-level intent
information. Experimental results show that MISCA outperforms previous models,
achieving new state-of-the-art overall accuracy performances on two benchmark
datasets MixATIS and MixSNIPS. This highlights the effectiveness of our
attention mechanisms.
- Abstract(参考訳): 複雑な現実の状況と関連性から,複数意図の検出やスロットの充填に関する研究が盛んになっている。
グラフに基づくジョイントモデルである最近の高度なアプローチは、まだ2つの潜在的な問題に直面しているかもしれない。
(i)事前の意図とスロットに基づいてグラフを構築することにより生じる不確実性は、意図とスロットの相関情報を不正確なラベルノードの宛先に転送することができる。
(ii)トークン単位のインテント投票ごとに複数のインテントラベルを直接組み込むと、スロット予測が誤っている可能性があるため、全体的なパフォーマンスが損なわれる可能性がある。
この2つの問題に対処するため,我々はmiscaというジョイントモデルを提案する。
我々のMISCAは、意図-スロットのコアテンション機構とラベルアテンション機構の基盤層を導入している。
これらのメカニズムによりmiscaはインテントとスロットラベルの相関を効果的に捉え、グラフ構築の必要性をなくすことができる。
インテントからスロットへ、スロットからインテントへ、複数のレベルのラベル固有の表現を通して、トークンレベルのインテント情報に頼ることなく、双方向の相関情報の転送も行う。
実験の結果、MISCAは従来のモデルよりも優れており、MixATISとMixSNIPSの2つのベンチマークデータセット上で、新しい最先端の全体的な精度性能を実現している。
これは注意機構の有効性を強調します。
関連論文リスト
- Slot Induction via Pre-trained Language Model Probing and Multi-level
Contrastive Learning [62.839109775887025]
トークンレベルのスロットアノテーションの明示的な知識なしでスロット境界を誘導することを目的としたスロットインジェクション(SI)タスク。
PLMから抽出した教師なし意味知識を活用するために、教師なし事前学習言語モデル(PLM)探索とコントラスト学習機構を活用することを提案する。
提案手法は,2つのNLUベンチマークデータセット上でトークンレベルの教師付きモデルとのギャップを埋めることができ,SIタスクに有効であることが示されている。
論文 参考訳(メタデータ) (2023-08-09T05:08:57Z) - A Dynamic Graph Interactive Framework with Label-Semantic Injection for
Spoken Language Understanding [43.48113981442722]
本稿では,まずラベルのセマンティック情報を利用して,モデルに付加的な信号を与え,よりリッチな事前情報を与える,DGIFというフレームワークを提案する。
本稿では,ラベルセマンティクスの注入に基づく対話型グラフ構築手法を提案する。
論文 参考訳(メタデータ) (2022-11-08T05:57:46Z) - Bi-directional Joint Neural Networks for Intent Classification and Slot
Filling [5.3361357265365035]
目的分類とスロットフィリングのための双方向ジョイントモデルを提案する。
本モデルでは,意図分類の精度,スロットフィリングF1,文レベルのセマンティックフレームの精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-02-26T06:35:21Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - Towards Joint Intent Detection and Slot Filling via Higher-order
Attention [47.78365472691051]
Intent Detection (ID) と Slot fill (SF) は、音声言語理解(SLU)における2つの主要なタスクである。
本稿では,文脈的およびチャネル的両線的アテンション分布を利用したバイリニアアテンションブロックを提案する。
我々のアプローチは最先端のアプローチと比較して改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-09-18T09:50:23Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - GL-GIN: Fast and Accurate Non-Autoregressive Model for Joint Multiple
Intent Detection and Slot Filling [31.833158491112005]
マルチインテントSLUは、発話中に複数のインテントを処理できるため、注目を集めている。
本稿では,複数方向検出とスロット充填のための非自己回帰モデルについて検討する。
我々のフレームワークは11.5倍高速で最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-06-03T15:22:38Z) - Online Multiple Object Tracking with Cross-Task Synergy [120.70085565030628]
位置予測と埋め込み結合の相乗効果を考慮した新しい統一モデルを提案する。
この2つのタスクは、時間認識対象の注意と注意の注意、およびアイデンティティ認識メモリ集約モデルによってリンクされる。
論文 参考訳(メタデータ) (2021-04-01T10:19:40Z) - AGIF: An Adaptive Graph-Interactive Framework for Joint Multiple Intent
Detection and Slot Filling [69.59096090788125]
本稿では,多目的検出とスロットフィリングを併用する適応グラフ対話フレームワーク(AGIF)を提案する。
スロットとインテントの強い相関関係をモデル化するために,インテント-スロットグラフ相互作用層を導入する。
このような相互作用層が各トークンに適応的に適用され、関連する意図情報を自動抽出する利点がある。
論文 参考訳(メタデータ) (2020-04-21T15:07:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。