論文の概要: Revisiting the Boundary between ASR and NLU in the Age of Conversational
Dialog Systems
- arxiv url: http://arxiv.org/abs/2112.05842v1
- Date: Fri, 10 Dec 2021 21:54:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-18 17:48:45.940041
- Title: Revisiting the Boundary between ASR and NLU in the Age of Conversational
Dialog Systems
- Title(参考訳): 対話型対話システムにおけるASRとNLUの境界の再検討
- Authors: Manaal Faruqui and Dilek Hakkani-T\"ur
- Abstract要約: 我々は、NLUは、対話システムのパイプラインで上流で使用されるASRモデルの存在を認識するべきであると論じる。
音声入力にセマンティックアノテーションを提供するエンドツーエンドデータセットが必要である。
ASRとNLU研究コミュニティの間には、より強力なコラボレーションがあるはずだ。
- 参考スコア(独自算出の注目度): 5.393453521362695
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: As more users across the world are interacting with dialog agents in their
daily life, there is a need for better speech understanding that calls for
renewed attention to the dynamics between research in automatic speech
recognition (ASR) and natural language understanding (NLU). We briefly review
these research areas and lay out the current relationship between them. In
light of the observations we make in this paper, we argue that (1) NLU should
be cognizant of the presence of ASR models being used upstream in a dialog
system's pipeline, (2) ASR should be able to learn from errors found in NLU,
(3) there is a need for end-to-end datasets that provide semantic annotations
on spoken input, (4) there should be stronger collaboration between ASR and NLU
research communities.
- Abstract(参考訳): 世界中のユーザーが日常的に対話エージェントと対話するようになるにつれ、音声認識の研究(asr)と自然言語理解(nlu)のダイナミクスに再び注意を向ける、より良い音声理解の必要性が高まっている。
我々は,これらの研究領域を概観し,それらの関係を概説する。
本稿では,(1)nluが上流で使用されているasrモデルの存在を認識すること,(2)nluにあるエラーからasrを学習できること,(3)音声入力に意味的アノテーションを提供するエンドツーエンドデータセットが必要であること,(4)asrとnlu研究コミュニティの間にはより強力なコラボレーションが必要であること,の2点を考察する。
関連論文リスト
- Joint Modelling of Spoken Language Understanding Tasks with Integrated
Dialog History [30.20353302347147]
本研究では,発話の意図,対話行動,話者の役割,感情を共同で予測するために,対話コンテキストを学習する新しいモデルアーキテクチャを提案する。
本実験は,タスク固有分類器と類似した結果が得られることを示す。
論文 参考訳(メタデータ) (2023-05-01T16:26:18Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - LUNA: Learning Slot-Turn Alignment for Dialogue State Tracking [21.80577241399013]
対話状態追跡(DST)は、対話履歴から現在の対話状態を予測することを目的としている。
既存のメソッドは通常、すべての対話の発話を利用して、各スロットの値を割り当てる。
sLot-tUrNアライメント拡張手法LUNAを提案する。
まず、各スロットを最も関連性の高い発話に明示的にアライメントし、さらに全ての対話発話の代わりに、このアライメントされた発話に基づいて対応する値を予測する。
論文 参考訳(メタデータ) (2022-05-05T10:18:23Z) - Back to the Future: Bidirectional Information Decoupling Network for
Multi-turn Dialogue Modeling [80.51094098799736]
ユニバーサル対話エンコーダとして双方向情報デカップリングネットワーク(BiDeN)を提案する。
BiDeNは過去と将来の両方のコンテキストを明示的に取り入れており、幅広い対話関連のタスクに一般化することができる。
異なる下流タスクのデータセットに対する実験結果は、我々のBiDeNの普遍性と有効性を示している。
論文 参考訳(メタデータ) (2022-04-18T03:51:46Z) - Knowledge Augmented BERT Mutual Network in Multi-turn Spoken Dialogues [6.4144180888492075]
本稿では,2つのSLUタスク間の対話コンテキストを相互に活用するために,BERTベースのジョイントモデルとナレッジアテンションモジュールを備えることを提案する。
さらにゲーティング機構を利用して、無関係な知識三重項をフィルタリングし、気を散らす理解を回避する。
2つの複雑なマルチターン対話データセットの実験的結果は、2つのSLUタスクをフィルター付き知識と対話コンテキストで相互にモデル化することで実証された。
論文 参考訳(メタデータ) (2022-02-23T04:03:35Z) - Neural Approaches to Conversational Information Retrieval [94.77863916314979]
会話情報検索(CIR)システムは、会話インタフェースを備えた情報検索(IR)システムである。
近年のディープラーニングの進歩により、自然言語処理(NLP)と会話型AIが大幅に改善されている。
この本は、ここ数年で開発された神経アプローチに焦点を当てた、CIRの最近の進歩を調査します。
論文 参考訳(メタデータ) (2022-01-13T19:04:59Z) - Graph Based Network with Contextualized Representations of Turns in
Dialogue [0.0]
対話に基づく関係抽出(RE)は、対話に現れる2つの引数間の関係を抽出することを目的としている。
本稿では,対話の理解方法に着目したTUCORE-GCN(TUrn Context aware Graph Convolutional Network)を提案する。
論文 参考訳(メタデータ) (2021-09-09T03:09:08Z) - Conversational Semantic Role Labeling [55.73065201984987]
本稿では,対話参加者,対話履歴中のフレーズ,あるいは現在の文を議論できる対話型srlタスクを提案する。
既存のSRLデータセットは文レベルにあるため、3,000のChit-chatダイアログのセマンティックロールを手動でアノテートします。
対話応答生成と対話コンテキスト書き換えという2つの主要な会話課題にCSRLを適用した最初の研究は、CSRLの有用性を裏付けるものである。
論文 参考訳(メタデータ) (2021-04-11T07:45:04Z) - Modelling Hierarchical Structure between Dialogue Policy and Natural
Language Generator with Option Framework for Task-oriented Dialogue System [49.39150449455407]
HDNOは、特定の対話行為表現の設計を避けるために潜在対話行為を設計するためのオプションフレームワークである。
RL,LaRL,HDSAで学習した単語レベルE2Eモデルと比較して,マルチドメイン対話のデータセットであるMultiWoz 2.0とMultiWoz 2.1でHDNOをテストする。
論文 参考訳(メタデータ) (2020-06-11T20:55:28Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。