論文の概要: "It's how you do things that matters": Attending to Process to Better
Serve Indigenous Communities with Language Technologies
- arxiv url: http://arxiv.org/abs/2402.02639v2
- Date: Tue, 6 Feb 2024 02:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 11:12:12.654871
- Title: "It's how you do things that matters": Attending to Process to Better
Serve Indigenous Communities with Language Technologies
- Title(参考訳): 「大切なことを行う方法だ」--先住民のコミュニティに言語技術をより良く提供するためのプロセスに参加する
- Authors: Ned Cooper, Courtney Heldreth, Ben Hutchinson
- Abstract要約: 本稿では,NLP技術の構築における倫理的考察について考察する。
本稿では,AbgenousおよびTorres Strait Islanderコミュニティの研究者17人とのインタビューについて報告する。
我々はNLP研究者に対して、先住民コミュニティとの関わりのプロセスに注意を向けるよう推奨する。
- 参考スコア(独自算出の注目度): 2.821682550792172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Indigenous languages are historically under-served by Natural Language
Processing (NLP) technologies, but this is changing for some languages with the
recent scaling of large multilingual models and an increased focus by the NLP
community on endangered languages. This position paper explores ethical
considerations in building NLP technologies for Indigenous languages, based on
the premise that such projects should primarily serve Indigenous communities.
We report on interviews with 17 researchers working in or with Aboriginal
and/or Torres Strait Islander communities on language technology projects in
Australia. Drawing on insights from the interviews, we recommend practices for
NLP researchers to increase attention to the process of engagements with
Indigenous communities, rather than focusing only on decontextualised
artefacts.
- Abstract(参考訳): 言語は歴史的に自然言語処理(NLP)技術で守られていないが、近年の大規模多言語モデルのスケーリングや、絶滅危惧言語に対するNLPコミュニティの関心の高まりにより、いくつかの言語では変化している。
本稿では,これらのプロジェクトが主に先住民コミュニティに役立てるべきという前提に基づいて,先住民言語のためのNLP技術構築における倫理的配慮について考察する。
オーストラリアにおける言語技術プロジェクトにおいて,アボリジニやトーレス海峡の島民コミュニティに勤務する17人の研究者とのインタビューを報告する。
インタビューから得られた知見に基づき,NLP研究者は,非コンテクスト化された人工物にのみ焦点をあてるのではなく,先住民コミュニティとの関わりに注意を向けるよう推奨する。
関連論文リスト
- Natural Language Processing for Dialects of a Language: A Survey [59.78833854847185]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Neural Machine Translation for the Indigenous Languages of the Americas:
An Introduction [102.13536517783837]
アメリカ大陸のほとんどの言語は、もしあるならば、並列データと単言語データしか持たない。
これらの言語におけるNLPコミュニティの関心が高まった結果、最近の進歩、発見、オープンな質問について論じる。
論文 参考訳(メタデータ) (2023-06-11T23:27:47Z) - Ethical Considerations for Machine Translation of Indigenous Languages:
Giving a Voice to the Speakers [40.84344504873471]
機械翻訳は、オープンソースの言語ペアにとって非常に成功している。
これは、インディネイティブ言語を含む低リソース言語の自動翻訳の研究に新たな関心を喚起した。
論文 参考訳(メタデータ) (2023-05-31T01:04:20Z) - Language Varieties of Italy: Technology Challenges and Opportunities [4.199528104335137]
イタリアはヨーロッパにおける一流の言語的多様性の風景を特徴としている。
イタリアのほとんどの地方言語や方言は、数世代以内に消滅する恐れがある。
論文 参考訳(メタデータ) (2022-09-20T14:39:12Z) - What a Creole Wants, What a Creole Needs [1.985426476051888]
我々は,低リソース言語であるクレオール言語群を考察する。クレオール言語はNLP文学にはほとんど欠落しており,また,スティグマのため社会全体から無視されることも多い。
クレオールの専門家との会話やクレオール話者コミュニティの調査を通じて、言語技術から必要なものが言語によって劇的に変化する様子を実演する。
論文 参考訳(メタデータ) (2022-06-01T12:22:34Z) - NusaX: Multilingual Parallel Sentiment Dataset for 10 Indonesian Local
Languages [100.59889279607432]
インドネシアにおける言語の資源開発に重点を置いている。
インドネシアのほとんどの言語は絶滅危惧種に分類され、一部は絶滅している。
インドネシアで10の低リソース言語を対象とした,最初の並列リソースを開発した。
論文 参考訳(メタデータ) (2022-05-31T17:03:50Z) - How can NLP Help Revitalize Endangered Languages? A Case Study and
Roadmap for the Cherokee Language [91.79339725967073]
世界で話されている言語の43%以上が危険にさらされている。
本研究では,NLPが絶滅危惧言語の再活性化にどう役立つかについて議論する。
私たちは、深刻な絶滅危惧言語であるチェロキーをケーススタディとして捉えています。
論文 参考訳(メタデータ) (2022-04-25T18:25:57Z) - Not always about you: Prioritizing community needs when developing
endangered language technology [5.670857685983896]
研究者や先住民の言語コミュニティのメンバーが直面する、ユニークな技術的、文化的、実践的、倫理的課題について論じる。
本報告では, 言語教師, マスタースピーカー, および先住民コミュニティの高齢者の視点と, 学術的視点について報告する。
論文 参考訳(メタデータ) (2022-04-12T05:59:39Z) - Ensuring the Inclusive Use of Natural Language Processing in the Global
Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。
我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-08-11T12:54:26Z) - Including Signed Languages in Natural Language Processing [48.62744923724317]
署名された言語は、聴覚障害者や難聴者のコミュニケーションの主な手段です。
このポジショニングペーパーは、NLPコミュニティに対して、社会的および科学的影響の高い研究領域として署名された言語を含めるよう求めている。
論文 参考訳(メタデータ) (2021-05-11T17:37:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。