論文の概要: An Efficient Self-Learning Framework For Interactive Spoken Dialog Systems
- arxiv url: http://arxiv.org/abs/2409.10515v1
- Date: Mon, 16 Sep 2024 17:59:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 14:38:40.439546
- Title: An Efficient Self-Learning Framework For Interactive Spoken Dialog Systems
- Title(参考訳): 対話型音声対話システムのための効率的な自己学習フレームワーク
- Authors: Hitesh Tulsiani, David M. Chan, Shalini Ghosh, Garima Lalwani, Prabhat Pandey, Ankish Bansal, Sri Garimella, Ariya Rastrow, Björn Hoffmeister,
- Abstract要約: ダイアログシステムにおけるASRの一般的なフレームワークを紹介する。
従来の学習と比較して,我々の新しいフレームワークを活用することで,実世界の対話システムにおいて比較的WERが10%近く削減されることが示されている。
- 参考スコア(独自算出の注目度): 18.829793635104608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialog systems, such as voice assistants, are expected to engage with users in complex, evolving conversations. Unfortunately, traditional automatic speech recognition (ASR) systems deployed in such applications are usually trained to recognize each turn independently and lack the ability to adapt to the conversational context or incorporate user feedback. In this work, we introduce a general framework for ASR in dialog systems that can go beyond learning from single-turn utterances and learn over time how to adapt to both explicit supervision and implicit user feedback present in multi-turn conversations. We accomplish that by leveraging advances in student-teacher learning and context-aware dialog processing, and designing contrastive self-supervision approaches with Ohm, a new online hard-negative mining approach. We show that leveraging our new framework compared to traditional training leads to relative WER reductions of close to 10% in real-world dialog systems, and up to 26% on public synthetic data.
- Abstract(参考訳): 音声アシスタントのような対話システムは、複雑で進化する会話にユーザと関わることが期待されている。
残念ながら、そのようなアプリケーションにデプロイされた従来の自動音声認識(ASR)システムは、通常、それぞれのターンを独立して認識するように訓練され、会話のコンテキストに適応する能力やユーザーフィードバックを組み込む能力が欠如している。
本研究では, 対話システムにおけるASRの一般的なフレームワークについて紹介し, シングルターン発話からの学習を超越し, 複数ターン会話における明示的な監視と暗黙的なユーザフィードバックの両方に適応する方法を時間とともに学習する。
学生教師の学習と文脈認識の対話処理の進歩を活用し、オンラインの強硬なマイニング手法であるOhmを用いて、対照的な自己超越的アプローチを設計することで実現した。
従来の学習と比較して,我々の新しいフレームワークを活用すると,実世界の対話システムではWERが10%近く削減され,公開合成データでは26%に向上することを示す。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - User Adaptive Language Learning Chatbots with a Curriculum [55.63893493019025]
語彙的に制約されたデコーディングをダイアログシステムに適用し、ダイアログシステムに対して、その生成した発話にカリキュラムに準拠した単語やフレーズを含めるよう促す。
評価の結果,カリキュラム注入によるダイアログシステムにより,対象語に対する生徒の理解が向上し,英語実践への関心が高まることが示された。
論文 参考訳(メタデータ) (2023-04-11T20:41:41Z) - Channel-aware Decoupling Network for Multi-turn Dialogue Comprehension [81.47133615169203]
本稿では,PrLMの逐次文脈化を超えて,発話間の包括的相互作用のための合成学習を提案する。
私たちは、モデルが対話ドメインに適応するのを助けるために、ドメイン適応型トレーニング戦略を採用しています。
実験の結果,提案手法は4つの公開ベンチマークデータセットにおいて,強力なPrLMベースラインを著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-01-10T13:18:25Z) - A Review of Dialogue Systems: From Trained Monkeys to Stochastic Parrots [0.0]
人工知能をデプロイして、人間と会話できる自動対話エージェントを構築することを目指している。
本稿では,長年にわたって対話システムを構築するために開発された手法について概説する。
論文 参考訳(メタデータ) (2021-11-02T08:07:55Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - Alexa Conversations: An Extensible Data-driven Approach for Building
Task-oriented Dialogue Systems [21.98135285833616]
従来の目標指向対話システムは、自然言語理解、対話状態追跡、政策学習、応答生成など、さまざまなコンポーネントに依存している。
スケーラブルかつデータ効率の高い,目標指向の対話システム構築のための新たなアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-19T07:09:27Z) - Action State Update Approach to Dialogue Management [16.602804535683553]
本稿では,発話解釈のための行動状態更新手法(ASU)を提案する。
我々のゴールは、ドメイン固有の自然言語理解コンポーネントを使わずに、ユーザ入力における参照表現を解釈することである。
ユーザシミュレーションと対話型評価の両方により,ASUアプローチは対話システムにおけるユーザの発話の解釈に成功していることを示す。
論文 参考訳(メタデータ) (2020-11-09T18:49:41Z) - Conversation Learner -- A Machine Teaching Tool for Building Dialog
Managers for Task-Oriented Dialog Systems [57.082447660944965]
Conversation Learnerは、ダイアログマネージャを構築するための機械学習ツールである。
ダイアログ作成者が慣れ親しんだツールを使ってダイアログフローを作成し、ダイアログフローをパラメトリックモデルに変換することができる。
ユーザシステムダイアログをトレーニングデータとして活用することで、ダイアログ作成者が時間とともにダイアログマネージャを改善することができる。
論文 参考訳(メタデータ) (2020-04-09T00:10:54Z) - Attention over Parameters for Dialogue Systems [69.48852519856331]
我々は,異なる対話スキルを個別にパラメータ化する対話システムを学び,AoP(Attention over Parameters)を通じてそれぞれを選択し,組み合わせることを学ぶ。
実験の結果,MultiWOZ,In-Car Assistant,Persona-Chatの複合データセット上での競合性能が得られた。
論文 参考訳(メタデータ) (2020-01-07T03:10:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。