論文の概要: Bilingual by default: Voice Assistants and the role of code-switching in
creating a bilingual user experience
- arxiv url: http://arxiv.org/abs/2206.09765v1
- Date: Mon, 20 Jun 2022 13:26:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-25 10:02:23.327526
- Title: Bilingual by default: Voice Assistants and the role of code-switching in
creating a bilingual user experience
- Title(参考訳): bilingual by default: 音声アシスタントとバイリンガルユーザエクスペリエンス作成におけるコードスイッチの役割
- Authors: Helin Cihan, Yunhan Wu, Paola Pe\~na, Justin Edwards, Benjamin Cowan
- Abstract要約: バイリンガルユーザのためのVAインタラクションにおいて直面する言語生産上の課題を強調した。
我々は、コードスイッチングのようなバイリンガル相互作用で見られる現象を促進することで、より包括的で改善されたユーザーエクスペリエンスを育むことができると論じる。
- 参考スコア(独自算出の注目度): 0.5047889990543175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversational User Interfaces such as Voice Assistants are hugely popular.
Yet they are designed to be monolingual by default, lacking support for, or
sensitivity to, the bilingual dialogue experience. In this provocation paper,
we highlight the language production challenges faced in VA interaction for
bilingual users. We argue that, by facilitating phenomena seen in bilingual
interaction, such as code-switching, we can foster a more inclusive and
improved user experience for bilingual users. We also explore ways that this
might be achieved, through the support of multiple language recognition as well
as being sensitive to the preferences of code-switching in speech output.
- Abstract(参考訳): ボイスアシスタントのような会話型ユーザーインタフェースは非常に人気がある。
しかし、それらはデフォルトでは単言語で、バイリンガルの対話体験に対するサポートや感受性が欠如しているように設計されている。
本稿では,バイリンガルユーザのためのvaインタラクションにおいて直面する言語生成の課題について述べる。
我々は、コードスイッチングのようなバイリンガルインタラクションで見られる現象を促進することで、バイリンガルユーザーにとってより包括的で改善されたユーザーエクスペリエンスを育むことができると論じる。
また、複数の言語認識をサポートし、音声出力におけるコード切り換えの好みに敏感であることにより、これを実現する方法も検討する。
関連論文リスト
- Code-switching in text and speech reveals information-theoretic audience design [5.3329709073809095]
コードスイッチングに影響を与える要因について,言語モデルを用いて検討する。
ある話者が1つの言語(第一言語)と別の言語(第二言語)を交互に話すとき、コードスイッチングが発生する
論文 参考訳(メタデータ) (2024-08-08T17:14:12Z) - Zero Resource Code-switched Speech Benchmark Using Speech Utterance Pairs For Multiple Spoken Languages [49.6922490267701]
我々は,自己教師型音声エンコーダのコード切替能力を評価するために,ゼロリソースコード切替音声ベンチマークを導入した。
本稿では,音声エンコーダのコードスイッチング能力を評価するために,離散単位に基づく言語モデリングのベースラインシステムを紹介する。
論文 参考訳(メタデータ) (2023-10-04T17:58:11Z) - Enhancing Multilingual Speech Recognition through Language Prompt Tuning
and Frame-Level Language Adapter [15.039113587886225]
本稿では,言語構成と言語に依存しない多言語音声認識を実現するための,シンプルかつパラメータ効率のよい2つの手法を提案する。
本実験は,提案手法を用いて,7言語にまたがる大幅な性能向上を示す。
論文 参考訳(メタデータ) (2023-09-18T02:51:59Z) - Hindi as a Second Language: Improving Visually Grounded Speech with
Semantically Similar Samples [89.16814518860357]
本研究の目的は,多言語の観点からの視覚的基盤音声モデル(VGS)の学習を検討することである。
この研究における重要な貢献は、低リソース言語の性能を向上させるために、バイリンガルな視覚的基盤を持つ音声モデルにおける高リソース言語のパワーを活用することである。
論文 参考訳(メタデータ) (2023-03-30T16:34:10Z) - Code-Switching without Switching: Language Agnostic End-to-End Speech
Translation [68.8204255655161]
我々は音声認識と翻訳を一貫したエンドツーエンドの音声翻訳問題として扱う。
LASTを両方の入力言語で訓練することにより、入力言語に関係なく、音声を1つのターゲット言語にデコードする。
論文 参考訳(メタデータ) (2022-10-04T10:34:25Z) - LAE: Language-Aware Encoder for Monolingual and Multilingual ASR [87.74794847245536]
言語固有の情報を混在させることにより,両状況に対処する新しい言語対応エンコーダ (LAE) アーキテクチャを提案する。
マンダリン・イングリッシュ・コードスウィッチ音声を用いた実験により,LAEはフレームレベルで異なる言語を識別できることが示唆された。
論文 参考訳(メタデータ) (2022-06-05T04:03:12Z) - Code Switched and Code Mixed Speech Recognition for Indic languages [0.0]
多言語自動音声認識(ASR)システムの訓練は、音響情報と語彙情報が典型的には言語固有のものであるため困難である。
言語識別(LID)に基づく一言語モデルとエンドツーエンドの多言語音声認識システムの性能を比較した。
また,Hindi- English と Bengali- English の相似解法を提案し,それぞれ 21.77 と 28.27 の WER を実現する。
論文 参考訳(メタデータ) (2022-03-30T18:09:28Z) - Joint Modeling of Code-Switched and Monolingual ASR via Conditional
Factorization [75.98664099579392]
本稿では,バイリンガル音声認識を構成するモノリンガルとコードスウィッチのサブタスクの可能性を共同でモデル化するための一般的な枠組みを提案する。
単言語およびコード切替コーパス間のバイリンガル・マンダリン・イングリッシュ音声認識における提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-11-29T23:14:54Z) - Transformer-Transducers for Code-Switched Speech Recognition [23.281314397784346]
コード切替音声認識のためのトランスフォーマー・トランスデューサモデルアーキテクチャを用いたエンドツーエンドのASRシステムを提案する。
まず、コードスイッチングの低リソースシナリオを扱うために、2つの補助損失関数を導入する。
第二に,言語ID情報を用いた新しいマスクベースのトレーニング戦略を提案し,文内コードスイッチングに向けたラベルエンコーダのトレーニングを改善する。
論文 参考訳(メタデータ) (2020-11-30T17:27:41Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。