論文の概要: Ethical Considerations for Machine Translation of Indigenous Languages:
Giving a Voice to the Speakers
- arxiv url: http://arxiv.org/abs/2305.19474v1
- Date: Wed, 31 May 2023 01:04:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 19:06:41.401227
- Title: Ethical Considerations for Machine Translation of Indigenous Languages:
Giving a Voice to the Speakers
- Title(参考訳): 内在言語機械翻訳の倫理的考察:話者に声を与える
- Authors: Manuel Mager, Elisabeth Mager, Katharina Kann, Ngoc Thang Vu
- Abstract要約: 機械翻訳は、オープンソースの言語ペアにとって非常に成功している。
これは、インディネイティブ言語を含む低リソース言語の自動翻訳の研究に新たな関心を喚起した。
- 参考スコア(独自算出の注目度): 40.84344504873471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years machine translation has become very successful for
high-resource language pairs. This has also sparked new interest in research on
the automatic translation of low-resource languages, including Indigenous
languages. However, the latter are deeply related to the ethnic and cultural
groups that speak (or used to speak) them. The data collection, modeling and
deploying machine translation systems thus result in new ethical questions that
must be addressed. Motivated by this, we first survey the existing literature
on ethical considerations for the documentation, translation, and general
natural language processing for Indigenous languages. Afterward, we conduct and
analyze an interview study to shed light on the positions of community leaders,
teachers, and language activists regarding ethical concerns for the automatic
translation of their languages. Our results show that the inclusion, at
different degrees, of native speakers and community members is vital to
performing better and more ethical research on Indigenous languages.
- Abstract(参考訳): 近年、高リソース言語ペアでは機械翻訳が非常に成功している。
これはまた、インディネイティブ言語を含む低リソース言語の自動翻訳の研究に新たな関心を喚起した。
しかし後者は、それらについて話す(または話すのに使用される)民族や文化グループと深く関係している。
データ収集、モデリング、機械翻訳システムのデプロイにより、対処しなければならない新たな倫理的問題が発生する。
そこで我々はまず,既存の文献の文書化,翻訳,一般自然言語処理に関する倫理的考察について調査した。
その後,我々は,言語の自動翻訳に関する倫理的懸念について,コミュニティリーダー,教師,言語活動家の立場に光を当てるために,インタビュー研究を実施し,分析する。
以上の結果から,母語話者とコミュニティメンバの包摂性は,先住民言語に関するより優れた倫理的な研究に不可欠であることが示唆された。
関連論文リスト
- A global AI community requires language-diverse publishing [1.4579344926652844]
我々は、英語の出版要件が、AIにおける幅広い抽出の体制を支え、強化していると論じる。
我々は3つのテーマを中心に組織されたより健康な出版文化のための代替的未来を提案する。
論文 参考訳(メタデータ) (2024-08-27T04:20:10Z) - Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.62071644137294]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。
Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。
私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文 参考訳(メタデータ) (2024-07-17T14:46:37Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - "It's how you do things that matters": Attending to Process to Better
Serve Indigenous Communities with Language Technologies [2.821682550792172]
本稿では,NLP技術の構築における倫理的考察について考察する。
本稿では,AbgenousおよびTorres Strait Islanderコミュニティの研究者17人とのインタビューについて報告する。
我々はNLP研究者に対して、先住民コミュニティとの関わりのプロセスに注意を向けるよう推奨する。
論文 参考訳(メタデータ) (2024-02-04T23:23:51Z) - Towards Bridging the Digital Language Divide [4.234367850767171]
多言語言語処理システムは、しばしばハードワイヤで、通常不随意で、特定の言語に対して隠された表現的嗜好を示す。
偏りのある技術は、しばしば表現される言語の複雑さに不公平な研究・開発手法の結果であることを示す。
我々は,技術設計と方法論の両面から,言語バイアスを減らすことを目的とした新しいイニシアティブを提案する。
論文 参考訳(メタデータ) (2023-07-25T10:53:20Z) - Neural Machine Translation for the Indigenous Languages of the Americas:
An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。
これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文 参考訳(メタデータ) (2023-06-11T23:27:47Z) - No Language Left Behind: Scaling Human-Centered Machine Translation [69.28110770760506]
低レベルの言語と高レベルの言語のパフォーマンスギャップを狭めるためのデータセットとモデルを作成します。
何千ものタスクをトレーニングしながらオーバーフィッティングに対処するために,複数のアーキテクチャとトレーニングの改善を提案する。
本モデルでは,従来の最先端技術と比較して,BLEUの44%の改善を実現している。
論文 参考訳(メタデータ) (2022-07-11T07:33:36Z) - Not always about you: Prioritizing community needs when developing
endangered language technology [5.670857685983896]
研究者や先住民の言語コミュニティのメンバーが直面する、ユニークな技術的、文化的、実践的、倫理的課題について論じる。
本報告では, 言語教師, マスタースピーカー, および先住民コミュニティの高齢者の視点と, 学術的視点について報告する。
論文 参考訳(メタデータ) (2022-04-12T05:59:39Z) - Ethical-Advice Taker: Do Language Models Understand Natural Language
Interventions? [62.74872383104381]
読解システムにおける自然言語介入の有効性について検討する。
本稿では,新たな言語理解タスクであるLingguistic Ethical Interventions (LEI)を提案する。
論文 参考訳(メタデータ) (2021-06-02T20:57:58Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。