論文の概要: A BiRGAT Model for Multi-intent Spoken Language Understanding with
Hierarchical Semantic Frames
- arxiv url: http://arxiv.org/abs/2402.18258v1
- Date: Wed, 28 Feb 2024 11:39:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 15:15:03.551091
- Title: A BiRGAT Model for Multi-intent Spoken Language Understanding with
Hierarchical Semantic Frames
- Title(参考訳): 階層的意味フレームを用いた多言語理解のためのbirgatモデル
- Authors: Hongshen Xu, Ruisheng Cao, Su Zhu, Sheng Jiang, Hanchong Zhang, Lu
Chen and Kai Yu
- Abstract要約: まず、MIVSと呼ばれる現実的な車載対話システムから収集されるマルチインテントデータセットを提案する。
対象のセマンティックフレームは、3層階層構造で構成され、多目的ケースにおけるアライメントとアライメントの問題に対処する。
我々は,2つの関係グラフアテンションネットワークであるアイテムの階層構造を符号化するBiRGATモデルを考案した。
- 参考スコア(独自算出の注目度): 30.200413352223347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous work on spoken language understanding (SLU) mainly focuses on
single-intent settings, where each input utterance merely contains one user
intent. This configuration significantly limits the surface form of user
utterances and the capacity of output semantics. In this work, we first propose
a Multi-Intent dataset which is collected from a realistic in-Vehicle dialogue
System, called MIVS. The target semantic frame is organized in a 3-layer
hierarchical structure to tackle the alignment and assignment problems in
multi-intent cases. Accordingly, we devise a BiRGAT model to encode the
hierarchy of ontology items, the backbone of which is a dual relational graph
attention network. Coupled with the 3-way pointer-generator decoder, our method
outperforms traditional sequence labeling and classification-based schemes by a
large margin.
- Abstract(参考訳): 音声言語理解(slu)に関する以前の研究は主に、各入力発話が単に1つのユーザの意図を含むシングルインテント設定に焦点を当てている。
この構成は、ユーザ発話の表面形態と出力意味論の能力を大幅に制限する。
そこで本研究では,MIVSと呼ばれる現実的な車載対話システムから収集したマルチインテントデータセットを提案する。
対象のセマンティクスフレームは、3層階層構造で構成され、マルチインテントケースにおけるアライメント問題と割り当て問題に取り組む。
そこで我々は,双対関係グラフアテンションネットワークである,オントロジー項目の階層構造を符号化するBiRGATモデルを考案した。
3ウェイポインタジェネレータデコーダと組み合わせて、従来のシーケンスラベリングや分類に基づくスキームを大きなマージンで上回ります。
関連論文リスト
- A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents [12.62162175115002]
本研究では,クエリから複数のインテントを抽出し,複数のインテントを検出すること,多言語インテントデータセットの開発という3つの重要な課題に対処する。
本稿では,既存のベンチマークデータセットから得られた新しいマルチラベルマルチクラスインテント検出データセット(MLMCID-dataset)を紹介する。
また,インテントスパンを抽出するポインターネットワークベースアーキテクチャ(MLMCID)を提案し,シャープレットの形で粗いラベルときめ細かなラベルで複数のインテントを検出する。
論文 参考訳(メタデータ) (2024-10-29T19:10:12Z) - Segment Any 3D Object with Language [58.471327490684295]
本稿では,Segment any 3D Object with LanguagE (SOLE)を紹介した。
具体的には、バックボーンとデコーダの両方にマルチモーダル意味を組み込むマルチモーダル融合ネットワークを提案する。
我々のSOLEは、ScanNetv2、ScanNet200、Replicaベンチマークにおいて、従来の方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2024-04-02T17:59:10Z) - Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - Guiding the PLMs with Semantic Anchors as Intermediate Supervision:
Towards Interpretable Semantic Parsing [57.11806632758607]
本稿では,既存の事前学習言語モデルを階層型デコーダネットワークに組み込むことを提案する。
第一原理構造をセマンティックアンカーとすることで、2つの新しい中間管理タスクを提案する。
いくつかのセマンティック解析ベンチマークで集中的な実験を行い、我々のアプローチがベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2022-10-04T07:27:29Z) - Dialogue Meaning Representation for Task-Oriented Dialogue Systems [51.91615150842267]
タスク指向対話のための柔軟かつ容易に拡張可能な表現である対話意味表現(DMR)を提案する。
我々の表現は、合成意味論とタスク固有の概念のためのリッチな意味論を表現するために、継承階層を持つノードとエッジのセットを含んでいる。
異なる機械学習ベースの対話モデルを評価するための2つの評価タスクを提案し、さらにグラフベースのコア参照解決タスクのための新しいコア参照解決モデルGNNCorefを提案する。
論文 参考訳(メタデータ) (2022-04-23T04:17:55Z) - A Template-guided Hybrid Pointer Network for
Knowledge-basedTask-oriented Dialogue Systems [15.654119998970499]
本稿では,知識に基づくタスク指向対話システムのためのテンプレート誘導型ハイブリッドポインタネットワークを提案する。
本研究では,ゲーティング機構を備えたメモリポインタネットワークモデルを設計し,検索した回答と接地トラス応答とのセマンティックな相関関係をフル活用する。
論文 参考訳(メタデータ) (2021-06-10T15:49:26Z) - Recurrent Neural Networks with Mixed Hierarchical Structures for Natural
Language Processing [13.960152426268767]
階層構造は言語処理と自然言語処理の両方に存在している。
自然言語の階層的表現を学習するためにRNNを設計する方法は、長年にわたる課題である。
本稿では,静的境界と動的境界という2種類の境界を定義し,文書分類タスクのための多層階層構造を構築する。
論文 参考訳(メタデータ) (2021-06-04T15:50:42Z) - Automatic Intent-Slot Induction for Dialogue Systems [5.6195418981579435]
我々はem自動インテントスロット誘導の新しいタスクを提案し,新しいドメイン非依存ツールを提案する。
すなわち、ロールラベル、コンセプトマイニング、パターンマイニングを含む3段階の粗い手順を設計する。
RCAPは良好なSLUスキーマを生成でき、最先端の教師あり学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-16T07:21:31Z) - AGIF: An Adaptive Graph-Interactive Framework for Joint Multiple Intent
Detection and Slot Filling [69.59096090788125]
本稿では,多目的検出とスロットフィリングを併用する適応グラフ対話フレームワーク(AGIF)を提案する。
スロットとインテントの強い相関関係をモデル化するために,インテント-スロットグラフ相互作用層を導入する。
このような相互作用層が各トークンに適応的に適用され、関連する意図情報を自動抽出する利点がある。
論文 参考訳(メタデータ) (2020-04-21T15:07:34Z) - MA-DST: Multi-Attention Based Scalable Dialog State Tracking [13.358314140896937]
ダイアログ状態追跡ダイアログは、ユーザーが目標を達成するための自然言語インターフェースを提供する。
正確なマルチドメインDSTを実現するためには、過去の発話とスロットセマンティクス間の依存関係をエンコードする必要がある。
本稿では,会話履歴とスロットの意味を符号化する新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-07T05:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。