論文の概要: Automatic Identification of Motivation for Code-Switching in Speech
Transcripts
- arxiv url: http://arxiv.org/abs/2212.08565v1
- Date: Wed, 30 Nov 2022 05:45:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 03:21:30.192137
- Title: Automatic Identification of Motivation for Code-Switching in Speech
Transcripts
- Title(参考訳): 音声書き起こしにおけるコード切り換えモチベーションの自動同定
- Authors: Ritu Belani and Jeffrey Flanigan
- Abstract要約: コードスイッチング(英: Code-switching)は、言語を切り替えることであり、言語学的、社会学的、文化的に重要な意味を持つ。
日々の音声で話者が音声で会話する幅広いモチベーションを自動的に識別するシステムを構築した。
新しい言語対に適応でき、新しい言語対(ヒンディー語-英語)で66%の精度を達成できることを示す。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code-switching, or switching between languages, occurs for many reasons and
has important linguistic, sociological, and cultural implications. Multilingual
speakers code-switch for a variety of purposes, such as expressing emotions,
borrowing terms, making jokes, introducing a new topic, etc. The reason for
code-switching may be quite useful for analysis, but is not readily apparent.
To remedy this situation, we annotate a new dataset of motivations for
code-switching in Spanish-English. We build the first system (to our knowledge)
to automatically identify a wide range of motivations that speakers code-switch
in everyday speech, achieving an accuracy of 75% across all motivations.
Additionally, we show that the system can be adapted to new language pairs,
achieving 66% accuracy on a new language pair (Hindi-English), demonstrating
the cross-lingual applicability of our annotation scheme
- Abstract(参考訳): コード交換、あるいは言語間の切り替えは、多くの理由から発生し、重要な言語的、社会学的、文化的意味合いを持っている。
多言語話者は、感情の表現、用語の借用、冗談の作り方、新しい話題の導入など、さまざまな目的でコードスイッチを行う。
コード切り換えの理由は分析に非常に有用かもしれないが、すぐには明らかではない。
この状況を改善するために、スペイン語でコードスイッチングを行うための新たなモチベーションデータセットを注釈付けします。
我々は、話し手が日常の音声でコード交換する幅広い動機を自動で識別する(我々の知識のために)最初のシステムを構築し、すべての動機に対して75%の正確さを達成します。
さらに、新しい言語対に適応し、新しい言語対(ヒンディー語-英語)に対して66%の精度を達成し、我々のアノテーションスキームの言語間適用性を示す。
関連論文リスト
- Code-switching in text and speech reveals information-theoretic audience design [5.3329709073809095]
コードスイッチングに影響を与える要因について,言語モデルを用いて検討する。
ある話者が1つの言語(第一言語)と別の言語(第二言語)を交互に話すとき、コードスイッチングが発生する
論文 参考訳(メタデータ) (2024-08-08T17:14:12Z) - Language Agnostic Code Embeddings [61.84835551549612]
私たちは、さまざまなプログラミング言語にまたがるコード埋め込みの言語間機能に重点を置いています。
1つは特定の言語のニュアンスと構文に深く結びついており、もう1つは詳細を知らない。
我々は、この言語固有のコンポーネントを分離して排除すると、下流のコード検索タスクが大幅に改善されることを示した。
論文 参考訳(メタデータ) (2023-10-25T17:34:52Z) - Simple yet Effective Code-Switching Language Identification with
Multitask Pre-Training and Transfer Learning [0.7242530499990028]
コードスイッチング(Code-switching)は、カジュアルな設定において、多言語話者が異なる言語の単語を1つの発話で混ぜる言語現象である。
英マンダリン言語指向音声データセットにおける言語識別精度向上のための2つの新しいアプローチを提案する。
我々の最良のモデルでは、実際の英マンダリンのコードスイッチングによる子指向音声コーパスにおいて、0.781のバランスの取れた精度を達成し、以前のベースラインを55.3%上回っている。
論文 参考訳(メタデータ) (2023-05-31T11:43:16Z) - LAE: Language-Aware Encoder for Monolingual and Multilingual ASR [87.74794847245536]
言語固有の情報を混在させることにより,両状況に対処する新しい言語対応エンコーダ (LAE) アーキテクチャを提案する。
マンダリン・イングリッシュ・コードスウィッチ音声を用いた実験により,LAEはフレームレベルで異なる言語を識別できることが示唆された。
論文 参考訳(メタデータ) (2022-06-05T04:03:12Z) - Reducing language context confusion for end-to-end code-switching
automatic speech recognition [50.89821865949395]
本稿では,E2E符号スイッチングASRモデルの多言語コンテキストの混同を低減するための言語関連アテンション機構を提案する。
複数の言語のそれぞれの注意を計算することにより、豊かな単言語データから言語知識を効率的に伝達することができる。
論文 参考訳(メタデータ) (2022-01-28T14:39:29Z) - Transformer-Transducers for Code-Switched Speech Recognition [23.281314397784346]
コード切替音声認識のためのトランスフォーマー・トランスデューサモデルアーキテクチャを用いたエンドツーエンドのASRシステムを提案する。
まず、コードスイッチングの低リソースシナリオを扱うために、2つの補助損失関数を導入する。
第二に,言語ID情報を用いた新しいマスクベースのトレーニング戦略を提案し,文内コードスイッチングに向けたラベルエンコーダのトレーニングを改善する。
論文 参考訳(メタデータ) (2020-11-30T17:27:41Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - NLP-CIC at SemEval-2020 Task 9: Analysing sentiment in code-switching
language using a simple deep-learning classifier [63.137661897716555]
コードスイッチングは、2つ以上の言語が同じメッセージで使用される現象である。
標準的な畳み込みニューラルネットワークモデルを用いて、スペイン語と英語の混在するツイートの感情を予測する。
論文 参考訳(メタデータ) (2020-09-07T19:57:09Z) - Phonological Features for 0-shot Multilingual Speech Synthesis [50.591267188664666]
単言語モデルにおいても,トレーニング中に見つからない言語に対して,コードスイッチングが可能であることを示す。
テスト時には、訓練で見たことのない音の近似を含む、新しい言語で、理解不能で、コードスイッチトされた音声を生成する。
論文 参考訳(メタデータ) (2020-08-06T18:25:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。