論文の概要: When Dialects Collide: How Socioeconomic Mixing Affects Language Use
- arxiv url: http://arxiv.org/abs/2307.10016v1
- Date: Wed, 19 Jul 2023 14:55:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 17:03:24.488488
- Title: When Dialects Collide: How Socioeconomic Mixing Affects Language Use
- Title(参考訳): Collideを語る: 社会経済の混在が言語利用に与える影響
- Authors: Thomas Louf, Jos\'e J. Ramasco, David S\'anchez, M\'arton Karsai
- Abstract要約: より異なる社会経済階級が混在するほど、標準文法からの離脱頻度と収入の相互依存度は低下する。
本稿では,データに見られる観察結果を生成するメカニズムに光を当てる,言語多様性導入のエージェントベースモデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The socioeconomic background of people and how they use standard forms of
language are not independent, as demonstrated in various sociolinguistic
studies. However, the extent to which these correlations may be influenced by
the mixing of people from different socioeconomic classes remains relatively
unexplored from a quantitative perspective. In this work we leverage geotagged
tweets and transferable computational methods to map deviations from standard
English on a large scale, in seven thousand administrative areas of England and
Wales. We combine these data with high-resolution income maps to assign a proxy
socioeconomic indicator to home-located users. Strikingly, across eight
metropolitan areas we find a consistent pattern suggesting that the more
different socioeconomic classes mix, the less interdependent the frequency of
their departures from standard grammar and their income become. Further, we
propose an agent-based model of linguistic variety adoption that sheds light on
the mechanisms that produce the observations seen in the data.
- Abstract(参考訳): 人々の社会経済的背景と標準言語の使用方法は、様々な社会言語学研究で示されているように、独立したものではない。
しかし、これらの相関関係が、異なる社会経済階級の人々の混合に影響される範囲は、量的観点からは比較的未解明のままである。
本研究では,イギリスとウェールズの7千の行政区域において,標準英語からの逸脱を大規模にマッピングするために,ジオタグ付きつぶやきと転送可能な計算手法を活用する。
これらのデータと高分解能所得マップを組み合わせることで、社会経済指標を家庭内利用者に割り当てる。
驚くべきことに、8つの大都市圏にまたがって、より異なる社会経済クラスが混ざり合うほど、標準文法からの離脱頻度と収入の相互依存度が低くなることを示唆する一貫したパターンが発見されている。
さらに,データに見られる観察結果を生成するメカニズムに光を当てる,言語多様性導入のエージェントベースモデルを提案する。
関連論文リスト
- On the Proper Treatment of Tokenization in Psycholinguistics [53.960910019072436]
論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文 参考訳(メタデータ) (2024-10-03T17:18:03Z) - The Devil is in the Neurons: Interpreting and Mitigating Social Biases in Pre-trained Language Models [78.69526166193236]
プレトレーニング言語モデル(PLM)は、社会的バイアスのような有害な情報を含むことが認識されている。
我々は,社会バイアスなどの望ましくない行動に起因する言語モデルにおいて,正確に単位(すなわちニューロン)を特定するために,sc Social Bias Neuronsを提案する。
StereoSetの以前の測定値からわかるように、我々のモデルは、低コストで言語モデリング能力を維持しながら、より高い公平性を達成する。
論文 参考訳(メタデータ) (2024-06-14T15:41:06Z) - Understanding Intrinsic Socioeconomic Biases in Large Language Models [4.276697874428501]
本稿では,社会経済的バイアスを定量化するために,100万の英語文からなる新しいデータセットを提案する。
以上の結果から,GPT-2のような確立されたモデルと,Llama 2やFalconのような最先端のモデルの両方において,社会経済的バイアスが広範にあることが明らかとなった。
論文 参考訳(メタデータ) (2024-05-28T23:54:44Z) - Detecting Bias in Large Language Models: Fine-tuned KcBERT [0.0]
我々は、このような害を社会的な偏見として定義し、韓国のコメントに微調整されたモデルで、民族、性別、人種的偏見を評価する。
我々の貢献は、言語に依存した特徴により、韓国語モデルに社会的バイアスが存在することを示すことである。
論文 参考訳(メタデータ) (2024-03-16T02:27:19Z) - Born With a Silver Spoon? Investigating Socioeconomic Bias in Large Language Models [1.4436965372953483]
大規模言語モデルで表現される社会経済的バイアスの度合いと,この度合いの変動をモデルサイズの関数として評価した。
分析の結果, 社会的に劣悪な言語モデルでは, 社会経済的に劣悪な言語モデルに共感できないことが判明した。
論文 参考訳(メタデータ) (2024-02-16T23:18:19Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Exposing Bias in Online Communities through Large-Scale Language Models [3.04585143845864]
この研究は、言語モデルにおけるバイアスの欠陥を使用して、6つの異なるオンラインコミュニティのバイアスを調査します。
得られたモデルのバイアスは、異なる人口層を持つモデルに促し、これらの世代における感情と毒性の値を比較することで評価される。
この作業は、トレーニングデータからバイアスがどの程度容易に吸収されるかを確認するだけでなく、さまざまなデータセットやコミュニティのバイアスを特定し比較するためのスケーラブルな方法も提示する。
論文 参考訳(メタデータ) (2023-06-04T08:09:26Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。