論文の概要: American cultural regions mapped through the lexical analysis of social
media
- arxiv url: http://arxiv.org/abs/2208.07649v1
- Date: Tue, 16 Aug 2022 10:18:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:47:50.046066
- Title: American cultural regions mapped through the lexical analysis of social
media
- Title(参考訳): ソーシャルメディアの語彙分析を通したアメリカの文化地域
- Authors: Thomas Louf, Bruno Gon\c{c}alves, Jose J. Ramasco, David Sanchez, Jack
Grieve
- Abstract要約: 本稿では,マイクロブログ投稿からの大規模データセットの自動解析に基づいて,文化的地域を推定する手法を提案する。
アメリカのソーシャルメディアで発生した記述談話の地域的変動を計測する。
提案手法は, 文化的領域を明確にし, それらの定義を議論する。
- 参考スコア(独自算出の注目度): 1.8199326045904993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cultural areas represent a useful concept that cross-fertilizes diverse
fields in social sciences. Knowledge of how humans organize and relate their
ideas and behavior within a society helps to understand their actions and
attitudes towards different issues. However, the selection of common traits
that shape a cultural area is somewhat arbitrary. What is needed is a method
that can leverage the massive amounts of data coming online, especially through
social media, to identify cultural regions without ad-hoc assumptions, biases
or prejudices. In this work, we take a crucial step towards this direction by
introducing a method to infer cultural regions based on the automatic analysis
of large datasets from microblogging posts. Our approach is based on the
principle that cultural affiliation can be inferred from the topics that people
discuss among themselves. Specifically, we measure regional variations in
written discourse generated in American social media. From the frequency
distributions of content words in geotagged Tweets, we find the words' usage
regional hotspots, and from there we derive principal components of regional
variation. Through a hierarchical clustering of the data in this
lower-dimensional space, our method yields clear cultural areas and the topics
of discussion that define them. We obtain a manifest North-South separation,
which is primarily influenced by the African American culture, and further
contiguous (East-West) and non-contiguous (urban-rural) divisions that provide
a comprehensive picture of today's cultural areas in the US.
- Abstract(参考訳): 文化圏は、社会科学の様々な分野を交配する有用な概念である。
人間がどのように社会の中で考えや行動を組織し、関連づけるかの知識は、異なる問題に対する行動や態度を理解するのに役立つ。
しかし、文化圏を形成する共通形質の選択は幾らか任意である。
必要なのは、オンラインからやってくる膨大なデータ、特にソーシャルメディアを通じて、アドホックな仮定や偏見、偏見のない文化的地域を特定する方法です。
本研究では,マイクロブログ投稿からの大規模データセットの自動解析に基づいて,文化地域を推定する手法を導入することで,この方向に向けて重要な一歩を踏み出す。
私たちのアプローチは、人々が自分達で議論するトピックから文化的提携を推論できるという原則に基づいています。
具体的には,米国のソーシャルメディアで発生した文言の地域差を測定した。
ジオタグ付きつぶやきにおけるコンテンツ単語の頻度分布から,単語の使用頻度を地域的ホットスポットとして把握し,そこから地域変動の主成分を導出する。
この低次元空間におけるデータの階層的クラスタリングを通じて、この手法は明確な文化的領域とそれらを定義する議論のトピックを生み出す。
我々は、主にアフリカ系アメリカ人文化の影響を受けやすい南北分離と、今日のアメリカの文化圏を包括的に捉えた、より連続した(東-西)と非連続的な(都市-農村)区分を得る。
関連論文リスト
- Investigating Cultural Alignment of Large Language Models [11.730822193746826]
LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文 参考訳(メタデータ) (2024-02-20T18:47:28Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - CREHate: A CRoss-cultural English Hate Speech Dataset [46.386059125840376]
ほとんどのNLPデータセットは言語話者の文化的多様性を無視しており、ヘイトスピーチ検出において重大な欠点をもたらす。
そこで本研究では,CRoss文化の英語Hate音声データセットであるCREHateを紹介する。
論文 参考訳(メタデータ) (2023-08-31T13:14:47Z) - Assessing Cross-Cultural Alignment between ChatGPT and Human Societies:
An Empirical Study [9.919972416590124]
ChatGPTは、対話で人間のような反応を生成できるという異常な能力で広く認知されている。
そこで我々は,ChatGPTの文化的背景を,人間の文化的差異を定量化するための質問に対する応答の分析によって検討した。
論文 参考訳(メタデータ) (2023-03-30T15:43:39Z) - Broaden the Vision: Geo-Diverse Visual Commonsense Reasoning [49.04866469947569]
地理的・地理的・地理的な共通点を理解する視覚・言語モデルの能力をテストするために,Geo-Diverse Visual Commonsense Reasoning dataset(GD-VCR)を構築した。
その結果,東アジア,南アジア,アフリカを含む非西欧地域での両モデルの性能は,西欧地域に比べて著しく低いことがわかった。
論文 参考訳(メタデータ) (2021-09-14T17:52:55Z) - Deception detection in text and its relation to the cultural dimension
of individualism/collectivism [6.17866386107486]
本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。
我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-05-26T13:09:47Z) - Cultural Cartography with Word Embeddings [0.0]
本稿では,単語の埋め込みが社会学における意味論とどのように一致しているかを示す。
まず、条件を一定に保ち、埋め込み空間が周囲をどう動くかを測定することができる。
第二に、埋め込み空間定数を保持して、ドキュメントや著者がそれに対してどのように動くかを確認することもできる。
論文 参考訳(メタデータ) (2020-07-09T01:58:28Z) - Placepedia: Comprehensive Place Understanding with Multi-Faceted
Annotations [79.80036503792985]
Placepediaは、240万のユニークな場所から3500万枚以上の写真を集めた大規模な場所データセットです。
写真に加えて、各場所にはGDP、人口など、膨大な多面的な情報も付属している。
このデータセットは大量のデータと豊富なアノテーションを持ち、様々な研究を行うことができる。
論文 参考訳(メタデータ) (2020-07-07T20:17:01Z) - From Topic Networks to Distributed Cognitive Maps: Zipfian Topic
Universes in the Area of Volunteered Geographic Information [59.0235296929395]
本研究では,テキストの話題レベルに関する地理情報のエンコードとネットワーク化について検討する。
本研究は,オンラインコミュニケーションにおいて地理的な場所が位置するテーマ宇宙のZipfian組織を示す。
互いに近いかどうかに関わらず、場所はトピックの宇宙における類似の作業にまたがる隣の場所にある。
論文 参考訳(メタデータ) (2020-02-04T18:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。