論文の概要: Knowledge-Aware Graph-Enhanced GPT-2 for Dialogue State Tracking
- arxiv url: http://arxiv.org/abs/2104.04466v1
- Date: Fri, 9 Apr 2021 16:27:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 14:12:47.894482
- Title: Knowledge-Aware Graph-Enhanced GPT-2 for Dialogue State Tracking
- Title(参考訳): 対話状態追跡のための知識対応グラフ強化GPT-2
- Authors: Weizhe Lin, Bo-Hsian Tseng, Bill Byrne
- Abstract要約: 本稿では,スロット値を1つずつ因果的に生成し,同時にスロット間情報交換を可能にする新しいアーキテクチャを提案する。
我々のモデルは、MultiWOZ 2.0で54.86%$のジョイント精度を実現し、スパース監視訓練で最大50.43%の性能を維持している。
本課題におけるグラフモデルの利用の意義を明らかにするために詳細な分析を行い,提案するグラフモジュールがより多くのスロット間関係を捉えるのに役立つことを示す。
- 参考スコア(独自算出の注目度): 11.756783748852856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialogue State Tracking is a crucial part of multi-domain task-oriented
dialogue systems, responsible for extracting information from user utterances.
We present a novel architecture that utilizes the powerful generative model
GPT-2 to generate slot values one by one causally, and at the same time
utilizes Graph Attention Networks to enable inter-slot information exchanges,
which exploits the inter-slot relations such as correlations. Our model
achieves $54.86\%$ joint accuracy in MultiWOZ 2.0, and it retains a performance
of up to $50.43\%$ in sparse supervision training, where only session-level
annotations ($14.3\%$ of the full training set) are used. We conduct detailed
analyses to demonstrate the significance of using graph models in this task,
and show by experiments that the proposed graph modules indeed help to capture
more inter-slot relations.
- Abstract(参考訳): 対話状態追跡は多ドメインタスク指向対話システムにおいて重要な部分であり、ユーザの発話から情報を抽出する役割を担う。
本稿では,強力な生成モデルgpt-2を用いて1つずつのスロット値を生成し,同時にグラフアテンションネットワークを用いて相関関係などのスロット間関係を利用したスロット間情報交換を実現する新しいアーキテクチャを提案する。
私たちのモデルは、multiwoz 2.0で54.86.%$のジョイント精度を達成し、セッションレベルのアノテーション(全トレーニングセットのうち14.3.%$)のみを使用する、スパース監督トレーニングにおいて最大50.43.%のパフォーマンスを保ちます。
本研究は,本課題におけるグラフモデルの有用性を示すための詳細な解析を行い,提案したグラフモジュールがスロット間関係の獲得に役立つことを示す。
関連論文リスト
- Scalable Weibull Graph Attention Autoencoder for Modeling Document Networks [50.42343781348247]
解析条件後部を解析し,推論精度を向上させるグラフポアソン因子分析法(GPFA)を開発した。
また,GPFAを多層構造に拡張したグラフPoisson gamma belief Network (GPGBN) を用いて,階層的な文書関係を複数の意味レベルで捉える。
本モデルでは,高品質な階層型文書表現を抽出し,様々なグラフ解析タスクにおいて有望な性能を実現する。
論文 参考訳(メタデータ) (2024-10-13T02:22:14Z) - Relating-Up: Advancing Graph Neural Networks through Inter-Graph Relationships [17.978546172777342]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学ぶのに優れています。
彼らの成功にもかかわらず、GNNはグラフ間の関係のコンテキストを無視して制限される。
本稿では,グラフ間の関係を利用してGNNを強化するプラグイン・アンド・プレイモジュールであるRelating-Upを紹介する。
論文 参考訳(メタデータ) (2024-05-07T02:16:54Z) - KERMIT: Knowledge Graph Completion of Enhanced Relation Modeling with Inverse Transformation [19.31783654838732]
大規模言語モデルを用いてコヒーレントな記述を生成し,クエリと回答のセマンティックなギャップを埋める。
また、逆関係を利用して対称グラフを作成し、KGCのための強化トレーニングサンプルを提供する。
提案手法は,WN18RRではHit@1が4.2%,FB15k-237ではHit@3が3.4%向上し,優れた性能を示した。
論文 参考訳(メタデータ) (2023-09-26T09:03:25Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z) - r-GAT: Relational Graph Attention Network for Multi-Relational Graphs [8.529080554172692]
Graph Attention Network (GAT)は、単純な無方向性グラフと単一のリレーショナルグラフデータのみをモデル化することに焦点を当てている。
マルチチャネルエンティティ表現を学習するための関係グラフアテンションネットワークであるr-GATを提案する。
リンク予測とエンティティ分類タスクの実験は、我々のr-GATがマルチリレーショナルグラフを効果的にモデル化できることを示します。
論文 参考訳(メタデータ) (2021-09-13T12:43:00Z) - Mutual Graph Learning for Camouflaged Object Detection [31.422775969808434]
主な課題は、前景の物体と背景の環境との固有の類似性によって、深いモデルによって抽出された特徴が区別できないことである。
我々は,正規格子からグラフ領域への従来の相互学習の考え方を一般化する,新しい相互グラフ学習モデルを設計する。
すべてのタスク間インタラクションをモデリングするために共有関数を使用するほとんどの相互学習アプローチとは対照的に、mglは異なる補完関係を扱うための型付き関数を備えている。
論文 参考訳(メタデータ) (2021-04-03T10:14:39Z) - Model-Agnostic Graph Regularization for Few-Shot Learning [60.64531995451357]
グラフ組み込み数ショット学習に関する包括的な研究を紹介します。
本稿では,ラベル間のグラフ情報の組み込みによる影響をより深く理解できるグラフ正規化手法を提案する。
提案手法は,Mini-ImageNetで最大2%,ImageNet-FSで6.7%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-02-14T05:28:13Z) - Learning Intents behind Interactions with Knowledge Graph for
Recommendation [93.08709357435991]
知識グラフ(KG)は、推薦システムにおいてますます重要な役割を果たす。
既存のGNNベースのモデルは、きめ細かいインテントレベルでのユーザ項目関係の特定に失敗します。
本稿では,新しいモデルである知識グラフベースインテントネットワーク(kgin)を提案する。
論文 参考訳(メタデータ) (2021-02-14T03:21:36Z) - Jointly Cross- and Self-Modal Graph Attention Network for Query-Based
Moment Localization [77.21951145754065]
本稿では,共同グラフを渡る反復的メッセージのプロセスとして,このタスクをリキャストするクロスモーダルグラフ注意ネットワーク(CSMGAN)を提案する。
CSMGANは2つのモード間の高次相互作用を効果的に捉えることができ、より正確な局所化を可能にします。
論文 参考訳(メタデータ) (2020-08-04T08:25:24Z) - A Graph-based Interactive Reasoning for Human-Object Interaction
Detection [71.50535113279551]
本稿では,HOIを推論するインタラクティブグラフ(Interactive Graph, in-Graph)という,グラフに基づくインタラクティブ推論モデルを提案する。
In-GraphNet と呼ばれる HOI を検出するための新しいフレームワークを構築した。
私たちのフレームワークはエンドツーエンドのトレーニングが可能で、人間のポーズのような高価なアノテーションはありません。
論文 参考訳(メタデータ) (2020-07-14T09:29:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。