論文の概要: Code-switching in text and speech reveals information-theoretic audience design
- arxiv url: http://arxiv.org/abs/2408.04596v1
- Date: Thu, 8 Aug 2024 17:14:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-09 14:58:04.766665
- Title: Code-switching in text and speech reveals information-theoretic audience design
- Title(参考訳): テキストと音声のコードスイッチングが情報理論のオーディエンスデザインを明らかに
- Authors: Debasmita Bhattacharya, Marten van Schijndel,
- Abstract要約: コードスイッチングに影響を与える要因について,言語モデルを用いて検討する。
ある話者が1つの言語(第一言語)と別の言語(第二言語)を交互に話すとき、コードスイッチングが発生する
- 参考スコア(独自算出の注目度): 5.3329709073809095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we use language modeling to investigate the factors that influence code-switching. Code-switching occurs when a speaker alternates between one language variety (the primary language) and another (the secondary language), and is widely observed in multilingual contexts. Recent work has shown that code-switching is often correlated with areas of high information load in the primary language, but it is unclear whether high primary language load only makes the secondary language relatively easier to produce at code-switching points (speaker-driven code-switching), or whether code-switching is additionally used by speakers to signal the need for greater attention on the part of listeners (audience-driven code-switching). In this paper, we use bilingual Chinese-English online forum posts and transcripts of spontaneous Chinese-English speech to replicate prior findings that high primary language (Chinese) information load is correlated with switches to the secondary language (English). We then demonstrate that the information load of the English productions is even higher than that of meaning equivalent Chinese alternatives, and these are therefore not easier to produce, providing evidence of audience-driven influences in code-switching at the level of the communication channel, not just at the sociolinguistic level, in both writing and speech.
- Abstract(参考訳): 本研究では,言語モデルを用いて,コードスイッチングに影響を与える要因について検討する。
コードスイッチングは、話者が1つの言語(一次言語)と他の言語(二次言語)を交互に切り替えた時に起こり、多言語文脈で広く見られる。
近年の研究では、コードスイッチングが一次言語における高い情報負荷の領域とよく相関していることが示されているが、高いプライマリ言語負荷が、コードスイッチングポイント(話者主導のコードスイッチング)において、二次言語のみを比較的容易に生成するかどうか、あるいはリスナ(聴衆主導のコードスイッチング)に注意を向ける必要性を示すために、話者がコードスイッチングを付加するかどうかが不明である。
本稿では,バイリンガルな中国語-英語オンラインフォーラム投稿と自発な中国語-英語音声の書き起こしを用いて,ハイプライマリ言語(中国語)の情報負荷が第2言語(英語)への切り替えと相関しているという先行的な知見を再現する。
そこで、我々は、英語生産の情報負荷が、同等の中国の代替品よりもさらに高いことを示し、それゆえ、これらは、書面・言論ともに、社会言語レベルだけでなく、コミュニケーションチャネルのレベルでのコードスイッチングにおけるオーディエンス主導の影響の証拠となる、作成が容易でないことを証明した。
関連論文リスト
- Multilingual self-supervised speech representations improve the speech
recognition of low-resource African languages with codeswitching [65.74653592668743]
微細な自己教師型多言語表現は絶対単語誤り率を最大20%削減する。
訓練データに制限のある状況では、自己教師付き表現を微調整することが、より良いパフォーマンスと実行可能なソリューションである。
論文 参考訳(メタデータ) (2023-11-25T17:05:21Z) - Measuring Entrainment in Spontaneous Code-switched Speech [3.9736028502700527]
我々は,人間間のコードスイッチによる自発音声における文字と音声のエントレメントのパターンについて検討した。
本研究は,コミュニケーション現象としてのエントレメントの「普遍的」性質に重要な意味を生じさせるものである。
論文 参考訳(メタデータ) (2023-11-13T19:41:34Z) - Simple yet Effective Code-Switching Language Identification with
Multitask Pre-Training and Transfer Learning [0.7242530499990028]
コードスイッチング(Code-switching)は、カジュアルな設定において、多言語話者が異なる言語の単語を1つの発話で混ぜる言語現象である。
英マンダリン言語指向音声データセットにおける言語識別精度向上のための2つの新しいアプローチを提案する。
我々の最良のモデルでは、実際の英マンダリンのコードスイッチングによる子指向音声コーパスにおいて、0.781のバランスの取れた精度を達成し、以前のベースラインを55.3%上回っている。
論文 参考訳(メタデータ) (2023-05-31T11:43:16Z) - Automatic Identification of Motivation for Code-Switching in Speech
Transcripts [3.8073142980733]
コードスイッチング(英: Code-switching)は、言語を切り替えることであり、言語学的、社会学的、文化的に重要な意味を持つ。
日々の音声で話者が音声で会話する幅広いモチベーションを自動的に識別するシステムを構築した。
新しい言語対に適応でき、新しい言語対(ヒンディー語-英語)で66%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-11-30T05:45:05Z) - Code-Switching without Switching: Language Agnostic End-to-End Speech
Translation [68.8204255655161]
我々は音声認識と翻訳を一貫したエンドツーエンドの音声翻訳問題として扱う。
LASTを両方の入力言語で訓練することにより、入力言語に関係なく、音声を1つのターゲット言語にデコードする。
論文 参考訳(メタデータ) (2022-10-04T10:34:25Z) - LAE: Language-Aware Encoder for Monolingual and Multilingual ASR [87.74794847245536]
言語固有の情報を混在させることにより,両状況に対処する新しい言語対応エンコーダ (LAE) アーキテクチャを提案する。
マンダリン・イングリッシュ・コードスウィッチ音声を用いた実験により,LAEはフレームレベルで異なる言語を識別できることが示唆された。
論文 参考訳(メタデータ) (2022-06-05T04:03:12Z) - Reducing language context confusion for end-to-end code-switching
automatic speech recognition [50.89821865949395]
本稿では,E2E符号スイッチングASRモデルの多言語コンテキストの混同を低減するための言語関連アテンション機構を提案する。
複数の言語のそれぞれの注意を計算することにより、豊かな単言語データから言語知識を効率的に伝達することができる。
論文 参考訳(メタデータ) (2022-01-28T14:39:29Z) - Transformer-Transducers for Code-Switched Speech Recognition [23.281314397784346]
コード切替音声認識のためのトランスフォーマー・トランスデューサモデルアーキテクチャを用いたエンドツーエンドのASRシステムを提案する。
まず、コードスイッチングの低リソースシナリオを扱うために、2つの補助損失関数を導入する。
第二に,言語ID情報を用いた新しいマスクベースのトレーニング戦略を提案し,文内コードスイッチングに向けたラベルエンコーダのトレーニングを改善する。
論文 参考訳(メタデータ) (2020-11-30T17:27:41Z) - Towards Code-switched Classification Exploiting Constituent Language
Resources [3.655021726150369]
我々は、モノリンガル設定とクロスランガル設定の両方を利用するために、コード切替データを構成言語に変換する。
我々は,英語とヒンディー語における2つの下流タスク,サルカズム検出とヘイトスピーチ検出の実験を行った。
論文 参考訳(メタデータ) (2020-11-03T18:43:19Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - Meta-Transfer Learning for Code-Switched Speech Recognition [72.84247387728999]
低リソース環境下でのコード切替音声認識システムにおける学習を伝達するメタトランスファー学習法を提案する。
本モデルでは,コードスイッチングデータに最適化を条件付けることにより,個々の言語を識別し,混合言語音声をよりよく認識できるように変換する。
論文 参考訳(メタデータ) (2020-04-29T14:27:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。