論文の概要: Mapping Language Literacy At Scale: A Case Study on Facebook
- arxiv url: http://arxiv.org/abs/2303.12179v1
- Date: Tue, 21 Mar 2023 20:24:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 16:04:30.483417
- Title: Mapping Language Literacy At Scale: A Case Study on Facebook
- Title(参考訳): 言語リテラシーを大規模にマッピングする: Facebookのケーススタディ
- Authors: Yu-Ru Lin and Shaomei Wu and Winter Mason
- Abstract要約: 本研究は,世界の160か国以上におけるオンライン人口の言語リテラシースキルを体系的に研究する。
本研究では,成人Facebook利用者の投稿を集約・非特定し,オンライン人口に対する人口レベルリテラシー推定手法を開発した。
Facebookでは、多くの国で女性が男性よりも高い言語リテラシーを示していますが、アフリカとアジアでは大きなギャップが残っています。
- 参考スコア(独自算出の注目度): 6.402634424631123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Literacy is one of the most fundamental skills for people to access and
navigate today's digital environment. This work systematically studies the
language literacy skills of online populations for more than 160 countries and
regions across the world, including many low-resourced countries where official
literacy data are particularly sparse. Leveraging public data on Facebook, we
develop a population-level literacy estimate for the online population that is
based on aggregated and de-identified public posts written by adult Facebook
users globally, significantly improving both the coverage and resolution of
existing literacy tracking data. We found that, on Facebook, women collectively
show higher language literacy than men in many countries, but substantial gaps
remain in Africa and Asia. Further, our analysis reveals a considerable
regional gap within a country that is associated with multiple socio-technical
inequalities, suggesting an "inequality paradox" -- where the online language
skill disparity interacts with offline socioeconomic inequalities in complex
ways. These findings have implications for global women's empowerment and
socioeconomic inequalities.
- Abstract(参考訳): リテラシーは、今日のデジタル環境にアクセスし、ナビゲートするための最も基本的なスキルの1つです。
この研究は、公的なリテラシーデータが特に希少である多くの低リソース国を含む、世界中の160か国以上のオンライン人口の言語リテラシースキルを体系的に研究している。
facebook上の公開データを活用することで、世界中の成人facebookユーザーが書いた投稿を集約・非特定したオンライン人口に対する人口レベルのリテラシー推定を開発し、既存のリテラシー追跡データのカバレッジと解決率の両方を大幅に改善する。
Facebookでは、多くの国で女性が男性よりも高い言語リテラシーを示していますが、アフリカとアジアでは大きなギャップが残っています。
さらに、分析の結果、複数の社会技術的不平等に関連する国内のかなりの地域格差が明らかとなり、オンライン言語スキルの格差が複雑な方法でオフラインの社会経済的不平等と相互作用する「不平等パラドックス」が示唆された。
これらの結果は、グローバルな女性のエンパワーメントと社会経済的不平等に影響を及ぼす。
関連論文リスト
- BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.92804151830744]
BRIGHTERは28の言語で感情アノテートされたデータセットの集合である。
データ収集とアノテーションプロセスとこれらのデータセット構築の課題について説明する。
BRIGHTERデータセットは、テキストベースの感情認識のギャップを埋めるためのステップであることを示す。
論文 参考訳(メタデータ) (2025-02-17T15:39:50Z) - Bridging the Data Provenance Gap Across Text, Speech and Video [67.72097952282262]
我々は、人気テキスト、音声、ビデオデータセットのモダリティにまたがって、最大かつ第1級の経時的監査を行う。
私たちの手動分析では、1990年から2024年の間に、608言語、798のソース、659の組織、67の国で4000近い公開データセットをカバーしています。
マルチモーダル機械学習アプリケーションは、トレーニングセットのために、YouTubeのようなWebcrawled、synthetic、ソーシャルメディアプラットフォームに圧倒的に移行した。
論文 参考訳(メタデータ) (2024-12-19T01:30:19Z) - The Call for Socially Aware Language Technologies [94.6762219597438]
NLPが機能する社会環境の要因、文脈、意味の認識の欠如である。
我々は、NLPが社会意識を発達させる上で大きな課題が残っており、この分野の新しい時代の始まりであると主張している。
論文 参考訳(メタデータ) (2024-05-03T18:12:39Z) - Classist Tools: Social Class Correlates with Performance in NLP [27.683676116781758]
社会デマトグラフィーの特徴は、自然言語処理において頻繁に使用される。
また,NLP の社会経済グループに対する不利は低いことが示唆された。
我々は、将来の言語技術に社会経済のクラスを取り入れることについて議論する。
論文 参考訳(メタデータ) (2024-03-07T12:27:08Z) - Social Intelligence Data Infrastructure: Structuring the Present and Navigating the Future [59.78608958395464]
私たちは、包括的な社会AI分類と480のNLPデータセットからなるデータライブラリで構成される、ソーシャルAIデータインフラストラクチャを構築しています。
インフラストラクチャにより、既存のデータセットの取り組みを分析し、異なるソーシャルインテリジェンスの観点から言語モデルのパフォーマンスを評価することができます。
多面的なデータセットの必要性、言語と文化の多様性の向上、より長期にわたる社会的状況、そして将来のソーシャルインテリジェンスデータ活動におけるよりインタラクティブなデータの必要性が示されている。
論文 参考訳(メタデータ) (2024-02-28T00:22:42Z) - Global Voices, Local Biases: Socio-Cultural Prejudices across Languages [22.92083941222383]
人間の偏見はユビキタスであるが、一様ではない。言語、文化、社会的境界を越えて格差が存在する。
本研究では,Word Embedding Association Test (WEAT) を24言語に拡張し,より広範な研究を可能にする。
より広く普及している社会的バイアスを包含するために、毒性、能力主義などにわたる新しいバイアス次元について検討する。
論文 参考訳(メタデータ) (2023-10-26T17:07:50Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Comparing Measures of Linguistic Diversity Across Social Media Language
Data and Census Data at Subnational Geographic Areas [1.0128808054306186]
本稿では,ニュージーランドのAotearoaにおけるオンライン空間(ソーシャルメディア言語データ)と実世界の空間の比較言語生態について述べる。
我々はこれらの異なる空間間の言語的多様性の尺度を比較し、ソーシャルメディアユーザーが現実世界の人口とどのように一致しているかについて議論する。
論文 参考訳(メタデータ) (2023-08-21T03:54:23Z) - Some Languages are More Equal than Others: Probing Deeper into the
Linguistic Disparity in the NLP World [2.0777058026628583]
NLP世界の言語格差は近年広く認識されている問題である。
本稿では,世界の言語に存在する格差を包括的に分析する。
論文 参考訳(メタデータ) (2022-10-16T12:50:30Z) - Mapping the Multilingual Margins: Intersectional Biases of Sentiment
Analysis Systems in English, Spanish, and Arabic [3.3458760961317635]
本稿では,4つの多言語エクイティ評価コーパス,社会的バイアスを測定するための補足的テストセット,および自然言語処理における一節的および交叉的社会的バイアスを研究するための新しい統計枠組みを紹介する。
我々はこれらのツールを用いて、英語、スペイン語、アラビア語の感情回帰タスクに基づいて訓練された5つのモデルにまたがる性別、人種、民族、および交差する社会的バイアスを測定する。
論文 参考訳(メタデータ) (2022-04-07T16:33:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。