論文の概要: Personalized Query Rewriting in Conversational AI Agents
- arxiv url: http://arxiv.org/abs/2011.04748v1
- Date: Mon, 9 Nov 2020 20:45:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 23:58:58.343772
- Title: Personalized Query Rewriting in Conversational AI Agents
- Title(参考訳): 対話型AIエージェントにおけるパーソナライズドクエリ書き換え
- Authors: Alireza Roshan-Ghias, Clint Solomon Mathialagan, Pragaash Ponnusamy,
Lambert Mathias, Chenlei Guo
- Abstract要約: 本稿では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
- 参考スコア(独自算出の注目度): 7.086654234990377
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spoken language understanding (SLU) systems in conversational AI agents often
experience errors in the form of misrecognitions by automatic speech
recognition (ASR) or semantic gaps in natural language understanding (NLU).
These errors easily translate to user frustrations, particularly so in
recurrent events e.g. regularly toggling an appliance, calling a frequent
contact, etc. In this work, we propose a query rewriting approach by leveraging
users' historically successful interactions as a form of memory. We present a
neural retrieval model and a pointer-generator network with hierarchical
attention and show that they perform significantly better at the query
rewriting task with the aforementioned user memories than without. We also
highlight how our approach with the proposed models leverages the structural
and semantic diversity in ASR's output towards recovering users' intents.
- Abstract(参考訳): 会話型AIエージェントの音声言語理解(SLU)システムは、音声認識(ASR)や自然言語理解(NLU)のセマンティックギャップによる誤認識の形でエラーを経験することが多い。
これらのエラーはユーザのフラストレーション、特にアプライアンスを定期的にトグしたり、頻繁なコンタクトを呼び出すなど、繰り返し発生するイベントに簡単に対応します。
本研究では,ユーザの歴史的に成功したインタラクションをメモリとして活用し,クエリ書き換え手法を提案する。
ニューラルネットワークモデルとポインタジェネレータネットワークに階層的な注意を払い、上述したユーザ記憶を用いたクエリ書き換えタスクにおいて、より優れた性能を発揮することを示す。
また,提案モデルを用いたアプローチが,asrのアウトプットの構造的および意味的多様性をユーザの意図の回復に活用する方法についても強調する。
関連論文リスト
- Do LLMs suffer from Multi-Party Hangover? A Diagnostic Approach to Addressee Recognition and Response Selection in Conversations [11.566214724241798]
本研究では,会話の特定の構造的属性間でのモデル性能を調査する手法を提案する。
我々はモデルの弱点を診断するために、応答選択とアドレス認識タスクに焦点をあてる。
その結果、応答選択は会話のテキストの内容に依存しており、アドレス認識ではその構造的次元を捉える必要があることがわかった。
論文 参考訳(メタデータ) (2024-09-27T10:07:33Z) - Towards interfacing large language models with ASR systems using confidence measures and prompting [54.39667883394458]
本研究では,大言語モデル(LLM)を用いたASRテキストのポストホック修正について検討する。
精度の高い転写文に誤りを導入することを避けるため,信頼度に基づくフィルタリング手法を提案する。
その結果,競争力の低いASRシステムの性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-07-31T08:00:41Z) - Improved Contextual Recognition In Automatic Speech Recognition Systems
By Semantic Lattice Rescoring [4.819085609772069]
本稿では,意味的格子処理によるASRシステム内における文脈認識の高度化のための新しい手法を提案する。
提案手法は,隠れマルコフモデルとガウス混合モデル(HMM-GMM)とディープニューラルネットワーク(DNN)モデルを用いて,精度を向上する。
本稿では,実験分析によるLibriSpeechデータセット上でのフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2023-10-14T23:16:05Z) - PICK: Polished & Informed Candidate Scoring for Knowledge-Grounded
Dialogue Systems [59.1250765143521]
現在の知識接地対話システムは、生成された応答を人間に好まれる品質に合わせるのに失敗することが多い。
我々は,世代別再描画フレームワークであるPolseed & Informed Candidate Scoring (PICK)を提案する。
対話履歴に関連性を維持しつつ,より忠実な応答を生成するためのPICKの有効性を示す。
論文 参考訳(メタデータ) (2023-09-19T08:27:09Z) - Graph Meets LLM: A Novel Approach to Collaborative Filtering for Robust
Conversational Understanding [20.934922599119865]
欠陥クエリは、自動音声認識(ASR)と自然言語理解(NLU)におけるユーザの曖昧さ、誤り、エラーから生じる可能性がある。
パーソナライズドクエリ書き換え(Personalized query rewriting)は、ユーザの個々の振る舞いや好みを考慮してクエリの欠陥を軽減するアプローチである。
本稿では,これまでユーザの歴史になかった新しいユーザインタラクションの書き直し作業に特に対処する「協調クエリ書き換え」手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T18:15:29Z) - On the Impact of Speech Recognition Errors in Passage Retrieval for
Spoken Question Answering [13.013751306590303]
合成ASR雑音に対する語彙・高密度レトリバーのロバスト性について検討した。
我々は,人間の声による質問を含む新しいデータセットを作成し,その書き起こしを用いて,合成ASRノイズの代わりに自然なASRノイズを扱う場合に,検索性能がさらに劣化することを示す。
論文 参考訳(メタデータ) (2022-09-26T18:29:36Z) - Decoupling Knowledge from Memorization: Retrieval-augmented Prompt
Learning [113.58691755215663]
一般化と記憶のバランスをとるためにRetroPromptを開発した。
バニラプロンプト学習とは対照的に、RetroPromptはトレーニングインスタンスからオープンブックナレッジストアを構築する。
大規模な実験により、RetroPromptは、数ショットとゼロショットの両方で、より良いパフォーマンスを得ることができることが示されている。
論文 参考訳(メタデータ) (2022-05-29T16:07:30Z) - User-Initiated Repetition-Based Recovery in Multi-Utterance Dialogue
Systems [3.20350998499235]
本稿では,誤解された単語を繰り返すことで,仮想アシスタントの音声認識誤りを補正するシステムを提案する。
ユーザがフレーズの一部を繰り返すと、システムは元のクエリを書き換えて修正を組み込む。
元のクエリを書き直すことは、繰り返しベースのリカバリを扱う効果的な方法であることを示す。
論文 参考訳(メタデータ) (2021-08-02T23:32:13Z) - Contextualized Attention-based Knowledge Transfer for Spoken
Conversational Question Answering [63.72278693825945]
音声対話型質問応答 (SCQA) は複雑な対話の流れをモデル化するために機械を必要とする。
本稿では,新しい文脈型注意型蒸留手法CADNetを提案する。
Spoken-CoQAデータセット上で広範な実験を行い、本手法が優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-10-21T15:17:18Z) - Improving Readability for Automatic Speech Recognition Transcription [50.86019112545596]
我々は、可読性のためのASRポストプロセッシング(APR)と呼ばれる新しいNLPタスクを提案する。
APRは、ノイズの多いASR出力を、話者の意味を保ちながら、人間や下流タスクのための読みやすいテキストに変換することを目的としている。
我々は,いくつかのオープンソースモデルと適応型事前学習モデルに基づく微調整モデルと,従来のパイプライン手法との比較を行った。
論文 参考訳(メタデータ) (2020-04-09T09:26:42Z) - Joint Contextual Modeling for ASR Correction and Language Understanding [60.230013453699975]
言語理解(LU)と協調してASR出力の文脈的言語補正を行うマルチタスクニューラルアプローチを提案する。
そこで本研究では,市販のASRおよびLUシステムの誤差率を,少量のドメイン内データを用いてトレーニングしたジョイントモデルと比較して14%削減できることを示した。
論文 参考訳(メタデータ) (2020-01-28T22:09:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。