論文の概要: Nollywood: Let's Go to the Movies!
- arxiv url: http://arxiv.org/abs/2407.02631v1
- Date: Tue, 2 Jul 2024 19:50:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 18:24:13.155148
- Title: Nollywood: Let's Go to the Movies!
- Title(参考訳): Nollywood: 映画を見に行こう!
- Authors: John E. Ortega, Ibrahim Said Ahmad, William Chen,
- Abstract要約: ナイジェリア英語をアメリカ英語に翻訳できる音声サブタイトルモデルを作成する。
また、最も高度な毒性検知器を用いて、音声がどれほど有害であるかを検知します。
我々の狙いは、方言理解の欠如からしばしば無視されるこれらのビデオのテキストを強調することである。
- 参考スコア(独自算出の注目度): 3.818480245025447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nollywood, based on the idea of Bollywood from India, is a series of outstanding movies that originate from Nigeria. Unfortunately, while the movies are in English, they are hard to understand for many native speakers due to the dialect of English that is spoken. In this article, we accomplish two goals: (1) create a phonetic sub-title model that is able to translate Nigerian English speech to American English and (2) use the most advanced toxicity detectors to discover how toxic the speech is. Our aim is to highlight the text in these videos which is often times ignored for lack of dialectal understanding due the fact that many people in Nigeria speak a native language like Hausa at home.
- Abstract(参考訳): ノリウッド(英: Nollywood)は、インド出身のボリウッドのアイデアを基にした、ナイジェリア発の一連の傑出した映画である。
残念ながら、映画は英語で書かれているが、話される英語の方言のため、多くの母語話者にとって理解が難しい。
本稿では,(1)ナイジェリア英語をアメリカ英語に翻訳できる音声サブタイトルモデルを作成し,(2)最も高度な毒性検知器を用いて,その音声がいかに有害であるかを明らかにする。
我々の狙いは、ナイジェリアの多くの人々が家庭でHausaのような母国語を話しているという事実から、方言理解の欠如からしばしば無視されるこれらのビデオのテキストを強調することである。
関連論文リスト
- Voices Unheard: NLP Resources and Models for Yorùbá Regional Dialects [72.18753241750964]
Yorub'aは、約4700万人の話者を持つアフリカの言語である。
アフリカ語のためのNLP技術開発への最近の取り組みは、彼らの標準方言に焦点を当てている。
我々は、このギャップを埋めるために、新しい高品質のパラレルテキストと音声コーパスを導入する。
論文 参考訳(メタデータ) (2024-06-27T22:38:04Z) - Does Generative AI speak Nigerian-Pidgin?: Issues about Representativeness and Bias for Multilingualism in LLMs [8.829688681748413]
ナイジャ語はナイジェリアで約1億2000万人の話者が話すナイジェリア・ピジン語である。
混成言語(英語、ポルトガル語、ヨルバ語、ハウサ語、イグボ語など)である。
西アフリカ・ピジン英語(西アフリカ・ピジン英語)(WAPE)として知られる西アフリカで話される大きなピジン語と非ネイティブで区別するのは困難である
論文 参考訳(メタデータ) (2024-04-30T10:45:40Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Low-Resource Counterspeech Generation for Indic Languages: The Case of
Bengali and Hindi [11.117463901375602]
私たちはBengaliやHindiといった低リソース言語のギャップを埋めています。
我々は5,062人の虐待的音声/音声ペアのベンチマークデータセットを作成する。
モノリンガル設定が最高のパフォーマンスをもたらすことを観察する。
論文 参考訳(メタデータ) (2024-02-11T18:09:50Z) - Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。
HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文 参考訳(メタデータ) (2023-11-02T01:17:29Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [66.79173000135717]
本研究は、カンナダ語とマラティ語という2つのインドの言語教育に適用する。
我々は、形態素構文(単語順、一致、ケースマーキング、または単語形成の学習)と意味論(語彙の学習)に関する疑問に答える自然なテキストコーパスから記述を抽出する。
我々は,北米の学校から言語教育者の助けを借りて手作業による評価を行い,教材が授業の準備や学習者評価に利用できる可能性を見出した。
論文 参考訳(メタデータ) (2023-10-27T18:17:29Z) - Technology Pipeline for Large Scale Cross-Lingual Dubbing of Lecture
Videos into Multiple Indian Languages [5.17905382659474]
講義ビデオの言語間ダビングには、オリジナルの音声の書き起こし、修正と不一致の除去が必要である。
本稿では,インド語の講義映像を半自動で再生する際の課題について述べる。
論文 参考訳(メタデータ) (2022-11-01T07:06:29Z) - yosm: A new yoruba sentiment corpus for movie reviews [2.3513645401551337]
ナイジェリア映画レビューにおける感情分析について考察する。
データにはIMDB、Rotten Tomatoes、Realboxd、Cinemapointer、Nollyratedなど1500本の映画レビューが含まれている。
我々は、mBERTやAfriBERTaといった最先端の事前訓練言語モデルを用いて、感情分類モデルを開発する。
論文 参考訳(メタデータ) (2022-04-20T18:00:37Z) - Unsupervised Transfer Learning in Multilingual Neural Machine
Translation with Cross-Lingual Word Embeddings [72.69253034282035]
我々は、言語独立多言語文表現を活用し、新しい言語に容易に一般化する。
複数のロマンス言語を含むベースシステムを用いてポルトガル語から盲目的に復号し、ポルトガル語では36.4 BLEU、ロシア語では12.8 BLEUのスコアを得た。
非反復的逆翻訳によるより実用的な適応アプローチを探求し、高品質の翻訳を生産するモデルの能力を活用します。
論文 参考訳(メタデータ) (2021-03-11T14:22:08Z) - Gender Bias, Social Bias and Representation: 70 Years of B$^H$ollywood [32.340056383090044]
ボリウッド対話における社会的バイアスと性バイアスの進化に関する総合的なNLP研究は存在しない。
我々は、微妙な社会的シグナルを研究するより広い文脈で、女性の描写を理解することを目指している。
人気映画コンテンツは、何らかの形での社会的規範や信念を反映している。
論文 参考訳(メタデータ) (2021-02-18T01:27:24Z) - Speaker Independent and Multilingual/Mixlingual Speech-Driven Talking
Head Generation Using Phonetic Posteriorgrams [58.617181880383605]
そこで本研究では,音声後部グラフを用いた新しい手法を提案する。
我々の手法は手作りの特徴を必要とせず、近年の手法に比べてノイズに強い。
本モデルは,複数言語/混合言語音声を説得力のある入力としてサポートした最初のモデルである。
論文 参考訳(メタデータ) (2020-06-20T16:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。