論文の概要: Impoverished Language Technology: The Lack of (Social) Class in NLP
- arxiv url: http://arxiv.org/abs/2403.03874v1
- Date: Wed, 6 Mar 2024 17:35:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 14:14:31.258207
- Title: Impoverished Language Technology: The Lack of (Social) Class in NLP
- Title(参考訳): 貧乏な言語技術: nlpにおける(ソーシャルな)クラスの欠如
- Authors: Amanda Cercas Curry, Zeerak Talat, Dirk Hovy
- Abstract要約: ラボフ(1964年)の言語社会成層に関する基礎研究以来、言語学は社会デコグラフィーの要因と言語生産と知覚の関係を理解するために、共同で努力してきた。
社会デミノグラフィー因子と言語生成の有意な関連性を示す証拠は多数存在するが,NLP技術の文脈において,これらの要因の比較的少数が研究されている。
年齢と性別はよくカバーされているが、ラボフの最初のターゲットである社会経済的階級はほとんど欠落している。
- 参考スコア(独自算出の注目度): 24.138711060814963
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Since Labov's (1964) foundational work on the social stratification of
language, linguistics has dedicated concerted efforts towards understanding the
relationships between socio-demographic factors and language production and
perception. Despite the large body of evidence identifying significant
relationships between socio-demographic factors and language production,
relatively few of these factors have been investigated in the context of NLP
technology. While age and gender are well covered, Labov's initial target,
socio-economic class, is largely absent. We survey the existing Natural
Language Processing (NLP) literature and find that only 20 papers even mention
socio-economic status. However, the majority of those papers do not engage with
class beyond collecting information of annotator-demographics. Given this
research lacuna, we provide a definition of class that can be operationalised
by NLP researchers, and argue for including socio-economic class in future
language technologies.
- Abstract(参考訳): ラボフ(1964年)の『言語社会の階層化に関する基礎研究』以来、言語学は社会デミック要因と言語生産と知覚の関係を理解することに尽力してきた。
社会デミノグラフィー因子と言語生成の有意な関連性を示す証拠は多数存在するが,NLP技術の文脈で研究されている要因は比較的少ない。
年齢と性別はよくカバーされているが、ラボフの最初のターゲットである社会経済的階級はほとんど欠落している。
既存の自然言語処理 (nlp) の文献を調査し, 社会経済的状況に言及する文献は20紙に過ぎなかった。
しかし、ほとんどの論文は注釈素数学の情報を収集する以外に授業には関わらない。
この研究を前提に,nlp研究者が運用可能なクラスの定義を提供し,今後の言語技術における社会経済的クラスの導入を論じる。
関連論文リスト
- The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - The Call for Socially Aware Language Technologies [94.6762219597438]
NLPが機能する社会環境の要因、文脈、意味の認識の欠如である。
我々は、NLPが社会意識を発達させる上で大きな課題が残っており、この分野の新しい時代の始まりであると主張している。
論文 参考訳(メタデータ) (2024-05-03T18:12:39Z) - Classist Tools: Social Class Correlates with Performance in NLP [27.683676116781758]
社会デマトグラフィーの特徴は、自然言語処理において頻繁に使用される。
また,NLP の社会経済グループに対する不利は低いことが示唆された。
我々は、将来の言語技術に社会経済のクラスを取り入れることについて議論する。
論文 参考訳(メタデータ) (2024-03-07T12:27:08Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - On the Limitations of Sociodemographic Adaptation with Transformers [34.768337465321395]
社会学的な要因(性別や年齢など)が我々の言語を形作っている。
これまでの研究は、特定の社会デマログラフィー要素を組み込むことで、様々なNLPタスクのパフォーマンスを継続的に改善できることを示した。
事前学習したトランスフォーマーに外部知識を組み込むのに有効な3つの共通特殊化手法を用いる。
論文 参考訳(メタデータ) (2022-08-01T17:58:02Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。