論文の概要: A Material Lens on Coloniality in NLP
- arxiv url: http://arxiv.org/abs/2311.08391v1
- Date: Tue, 14 Nov 2023 18:52:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-15 12:48:25.225993
- Title: A Material Lens on Coloniality in NLP
- Title(参考訳): NLPのコロニー性に関する材料レンズ
- Authors: William Held, Camille Harris, Michael Best, Diyi Yang
- Abstract要約: 植民地化は「公式」植民地化を超えて植民地の被害を継続することである。
我々は、植民地性は暗黙的にNLPデータ、アルゴリズム、ソフトウェアに埋め込まれ、増幅されていると主張している。
- 参考スコア(独自算出の注目度): 57.63027898794855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coloniality, the continuation of colonial harms beyond "official"
colonization, has pervasive effects across society and scientific fields.
Natural Language Processing (NLP) is no exception to this broad phenomenon. In
this work, we argue that coloniality is implicitly embedded in and amplified by
NLP data, algorithms, and software. We formalize this analysis using
Actor-Network Theory (ANT): an approach to understanding social phenomena
through the network of relationships between human stakeholders and technology.
We use our Actor-Network to guide a quantitative survey of the geography of
different phases of NLP research, providing evidence that inequality along
colonial boundaries increases as NLP builds on itself. Based on this, we argue
that combating coloniality in NLP requires not only changing current values but
also active work to remove the accumulation of colonial ideals in our
foundational data and algorithms.
- Abstract(参考訳): 植民地性は「公式」植民地化を超えて植民地的被害を継続し、社会や科学分野に広範に影響を与えている。
自然言語処理(NLP)はこの広範な現象の例外ではない。
本研究では、NLPデータ、アルゴリズム、ソフトウェアに植民地性が暗黙的に埋め込まれ、増幅されていることを論じる。
アクターネットワーク理論(ANT:Actor-Network Theory)を用いてこの分析を形式化する。
我々は,NLP研究の異なる段階の地理を定量的に調査するためにアクター・ネットワークを使用し,NLP自体が構築されるにつれて,植民地境界に沿った不平等が増大することを示す。
これを踏まえて,nlpにおける植民地性への対処には,現在の価値観を変えるだけでなく,基礎データやアルゴリズムにおける植民地性イデアルの蓄積を取り除くための活動的な作業が必要であると論じた。
関連論文リスト
- The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - Reimagining Communities through Transnational Bengali Decolonial Discourse with YouTube Content Creators [2.3977477455080085]
本研究は,ビデオによるデコロナール談話への人々のモチベーションと戦略を理解することを目的としている。
本稿では,オンライン・デコロニアル・談話の社会物質性の可能性について論じる。
論文 参考訳(メタデータ) (2024-07-18T03:41:39Z) - Decolonial AI as Disenclosure [0.0]
機械学習とAIによる「AI植民地主義」は、概念的には「データ植民地主義」と重なる用語であり、不正の一形態である。
政治的には、デジタル資本主義のヘゲモニーを強制するが、生態学的には環境に悪影響を及ぼし、天然資源の抽出とエネルギー消費を増大させる。
論文 参考訳(メタデータ) (2024-05-23T09:45:37Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - In Consideration of Indigenous Data Sovereignty: Data Mining as a
Colonial Practice [0.0]
本研究は、個人データソブリンティを取り入れることの必要性を強調している。
この仮説を支持し、この問題に対処するために、CARE Principles for Indigenous Data Governanceが適用される。
論文 参考訳(メタデータ) (2023-09-19T00:00:35Z) - Decolonial AI Alignment: Openness, Viśe\d{s}a-Dharma, and Including Excluded Knowledges [22.21928139733195]
植民地主義は、植民地化された人々の信念と価値観を変える歴史を持っていると私は主張する。
AIアライメントは3種類のオープンネスを使って非植民地化することを提案します。
1つの概念は「Vi'sedsa-dharma」または「正しいことと間違ったこと」という文脈固有の概念である。
論文 参考訳(メタデータ) (2023-09-10T14:04:21Z) - Beyond Good Intentions: Reporting the Research Landscape of NLP for
Social Good [115.1507728564964]
NLP4SG Papersは3つのタスクを関連づけた科学データセットである。
これらのタスクはNLP4SGの論文を特定し、NLP4SGのランドスケープを特徴付けるのに役立つ。
現状のNLPモデルを用いてこれらのタスクに対処し、ACLアンソロジー全体においてそれらを使用する。
論文 参考訳(メタデータ) (2023-05-09T14:16:25Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - Re-contextualizing Fairness in NLP: The Case of India [9.919007681131804]
インドの文脈におけるNLPフェアネスに焦点を当てる。
インドの文脈における公平性評価のためのリソースを構築します。
次に、我々は地域と宗教の社会的ステレオタイプを深く掘り下げ、コーパスとモデルにおけるその普及を実証した。
論文 参考訳(メタデータ) (2022-09-25T13:56:13Z) - Grounding 'Grounding' in NLP [59.28887479119075]
コミュニティとして、この用語は、テキストをデータや非テキストのモダリティにリンクするために広く使われます。
認知科学(Cognitive Science)は、コミュニケーションの成功に必要な相互情報を確立するプロセスとして「接地」を正式に定義している。
論文 参考訳(メタデータ) (2021-06-04T00:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。