Fugu-MT 論文翻訳(概要): Dialect and Gender Bias in YouTube's Spanish Captioning System

論文の概要: Dialect and Gender Bias in YouTube's Spanish Captioning System

arxiv url: http://arxiv.org/abs/2602.24002v1
Date: Fri, 27 Feb 2026 13:26:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-02 19:48:24.437221
Title: Dialect and Gender Bias in YouTube's Spanish Captioning System
Title（参考訳）: YouTubeのスペイン語字幕システムにおける方言とジェンダーのバイアス
Authors: Iris Dania Jimenez, Christoph Kern,
Abstract要約: 本研究では,YouTubeの自動キャプションシステムにおける潜在的なバイアスについて,その性能を様々なスペイン語方言で分析することによって検討する。地域によって異なる女性話者と男性話者のキャプションの質を比較することにより,特定の方言に起因した系統的差異を同定する。
参考スコア（独自算出の注目度）: 0.9379766111875706
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Spanish is the official language of twenty-one countries and is spoken by over 441 million people. Naturally, there are many variations in how Spanish is spoken across these countries. Media platforms such as YouTube rely on automatic speech recognition systems to make their content accessible to different groups of users. However, YouTube offers only one option for automatically generating captions in Spanish. This raises the question: could this captioning system be biased against certain Spanish dialects? This study examines the potential biases in YouTube's automatic captioning system by analyzing its performance across various Spanish dialects. By comparing the quality of captions for female and male speakers from different regions, we identify systematic disparities which can be attributed to specific dialects. Our study provides further evidence that algorithmic technologies deployed on digital platforms need to be calibrated to the diverse needs and experiences of their user populations.
Abstract（参考訳）: スペイン語は21カ国の公用語であり、4億4100万人以上の人々が話している。当然、これらの国でスペイン語が話される方法には多くのバリエーションがある。 YouTubeのようなメディアプラットフォームは、ユーザーの異なるグループにコンテンツをアクセスできるようにするために自動音声認識システムに依存している。しかし、YouTubeはスペイン語でキャプションを自動的に生成するオプションを1つだけ提供している。このキャプションシステムは、特定のスペイン語方言に偏りがあるのだろうか? 本研究では,YouTubeの自動キャプションシステムにおける潜在的なバイアスについて,その性能を様々なスペイン語方言で分析することによって検討する。地域によって異なる女性話者と男性話者のキャプションの質を比較することにより,特定の方言に起因した系統的差異を同定する。我々の研究は、デジタルプラットフォームに展開するアルゴリズム技術が、ユーザ人口の多様なニーズや経験に合わせて調整される必要があるという、さらなる証拠を提供する。

関連論文リスト

Digital Linguistic Bias in Spanish: Evidence from Lexical Variation in LLMs [0.4771833920251869]
本研究では,Large Language Models (LLMs) がスペイン語の地理的語彙変化をどの程度捉えているかを検討する。 LLMを仮想情報量として扱うことで、2つの調査スタイルの質問形式を用いて弁証的知識を探索する。スペイン語圏21カ国で900以上の語彙項目を対象とし,国と方言圏の双方で実施した。
論文参考訳（メタデータ） (2026-02-10T02:42:22Z)
Literary and Colloquial Dialect Identification for Tamil using Acoustic Features [0.0]
音声技術は、言語の様々な方言が絶滅しないようにする役割を担っている。現在の研究は、人気のある2つのタミル方言と広く分類されたタミル方言を識別する方法を提案する。
論文参考訳（メタデータ） (2024-08-27T09:00:27Z)
What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文参考訳（メタデータ） (2024-02-19T09:15:28Z)
LIP-RTVE: An Audiovisual Database for Continuous Spanish in the Wild [0.0]
本稿では,制約のない自然スペイン語を扱うための半自動注釈付き音声視覚データベースを提案する。隠れマルコフモデルを用いて話者に依存しないシナリオと話者に依存しないシナリオの両方の結果を報告する。
論文参考訳（メタデータ） (2023-11-21T09:12:21Z)
Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。 HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文参考訳（メタデータ） (2023-11-02T01:17:29Z)
A Deep Dive into the Disparity of Word Error Rates Across Thousands of NPTEL MOOC Videos [4.809236881780707]
英語のSsim9.8$Kの技術講義とインド・デモグラフィーの様々な部分を表すインストラクターによる書き起こしからなる8740時間の大規模音声データセットのキュレーションについて述べる。私たちは、キュレートされたデータセットを使用して、インドの多様な話者の人口統計学的特徴にまたがる、YouTube Automatic CaptionsとOpenAI Whisperモデルのパフォーマンスの既存の格差を測定します。
論文参考訳（メタデータ） (2023-07-20T05:03:00Z)
Comparing Biases and the Impact of Multilingual Training across Multiple Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文参考訳（メタデータ） (2023-05-18T18:15:07Z)
Multi-VALUE: A Framework for Cross-Dialectal English NLP [49.55176102659081]
マルチディレクト (Multi-Dilect) は、50の英語方言にまたがる制御可能なルールベースの翻訳システムである。ストレステストは、非標準方言の先行モデルに対する顕著な性能格差を示す。私たちはチカノやインド英語のネイティブスピーカーと提携して、人気のあるCoQAタスクの新しいゴールドスタンダード版をリリースしています。
論文参考訳（メタデータ） (2022-12-15T18:17:01Z)
Towards Generating Diverse Audio Captions via Adversarial Training [33.76154801580643]
音声キャプションシステムの多様性を向上させるために,条件付き生成対向ネットワーク(C-GAN)を提案する。キャプションジェネレータと2つのハイブリッドディスクリミネータが競合し、共同で学習し、キャプションジェネレータは、キャプションを生成するのに使用される標準エンコーダデコーダキャプションモデルとなることができる。その結果,提案モデルでは,最先端手法と比較して,より多様性の高いキャプションを生成できることが示唆された。
論文参考訳（メタデータ） (2022-12-05T05:06:19Z)
Cross-lingual Transfer for Speech Processing using Acoustic Language Similarity [81.51206991542242]
言語間の移動は、このデジタル分割を橋渡しする魅力的な方法を提供する。現在の言語間アルゴリズムは、テキストベースのタスクや音声関連タスクを低リソース言語で実現している。本稿では,数百の言語をまたがる音響的言語間移動対を効率的に同定する言語類似性手法を提案する。
論文参考訳（メタデータ） (2021-11-02T01:55:17Z)
A large scale lexical and semantic analysis of Spanish language variations in Twitter [2.3511629321667096]
この写本は、世界中の26のスペイン語を話す国間での語彙的・意味的な関係について広く分析している。我々は、Twitterのジオタグ付き公開ストリームの4年間を分析し、さまざまな国のスペイン語語彙を広範囲に調査した。
論文参考訳（メタデータ） (2021-10-12T16:21:03Z)
That Sounds Familiar: an Analysis of Phonetic Representations Transfer Across Languages [72.9927937955371]
我々は、他言語に存在するリソースを用いて、多言語自動音声認識モデルを訓練する。我々は,多言語設定における全言語間での大幅な改善と,多言語設定におけるスターク劣化を観察した。分析の結果、ひとつの言語に固有の電話でさえ、他の言語からのトレーニングデータを追加することで大きなメリットがあることがわかった。
論文参考訳（メタデータ） (2020-05-16T22:28:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。