論文の概要: Geolocation differences of language use in urban areas
- arxiv url: http://arxiv.org/abs/2108.00533v1
- Date: Sun, 1 Aug 2021 19:55:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:23:52.336957
- Title: Geolocation differences of language use in urban areas
- Title(参考訳): 都市部における言語利用の地域差
- Authors: Olga Kellert and Nicholas H. Matlis
- Abstract要約: 都市部における言語利用の空間的変動を解決するために,正確な位置情報情報を用いたTwitterデータの利用について検討した。
本研究は,小規模変動の分析により,言語使用と社会的文脈の相関関係について一意的な情報が得られることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The explosion in the availability of natural language data in the era of
social media has given rise to a host of applications such as sentiment
analysis and opinion mining. Simultaneously, the growing availability of
precise geolocation information is enabling visualization of global phenomena
such as environmental changes and disease propagation. Opportunities for
tracking spatial variations in language use, however, have largely been
overlooked, especially on small spatial scales. Here we explore the use of
Twitter data with precise geolocation information to resolve spatial variations
in language use on an urban scale down to single city blocks. We identify
several categories of language tokens likely to show distinctive patterns of
use and develop quantitative methods to visualize the spatial distributions
associated with these patterns. Our analysis concentrates on comparison of
contrasting pairs of Tweet distributions from the same category, each defined
by a set of tokens. Our work shows that analysis of small-scale variations can
provide unique information on correlations between language use and social
context which are highly valuable to a wide range of fields from linguistic
science and commercial advertising to social services.
- Abstract(参考訳): ソーシャルメディア時代における自然言語データの利用が爆発的に増加し、感情分析や意見マイニングといった様々な応用がもたらされた。
同時に、正確な位置情報の可用性が高まり、環境変化や病気の伝播といった大域的な現象の可視化が可能になる。
しかし、言語使用の空間的変化を追跡する機会は、特に小さな空間規模で見過ごされている。
ここでは,都市規模から都市単位までの言語利用の空間的変動を解決するために,正確な位置情報を用いたtwitterデータの利用について検討する。
言語トークンのいくつかのカテゴリを識別し,これらのパターンに関連する空間分布を定量的に可視化する手法を開発した。
分析では、同じカテゴリから、それぞれがトークンの集合によって定義されるツイートのコントラスト対の比較に集中する。
本研究は, 言語科学, 商業広告, ソーシャルサービスなど, 幅広い分野において, 言語利用と社会的文脈の相関関係に関する一意的な情報を提供することができることを示す。
関連論文リスト
- Exploring language relations through syntactic distances and geographic proximity [0.4369550829556578]
ユニバーサル依存データセットから抽出した音声の一連の部分(POS)を用いて言語間距離を探索する。
特定の形態的類型によって説明される例外を除いて、よく知られた言語族やグループに対応する定型クラスタが見つかる。
論文 参考訳(メタデータ) (2024-03-27T10:36:17Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Comparing Measures of Linguistic Diversity Across Social Media Language
Data and Census Data at Subnational Geographic Areas [1.0128808054306186]
本稿では,ニュージーランドのAotearoaにおけるオンライン空間(ソーシャルメディア言語データ)と実世界の空間の比較言語生態について述べる。
我々はこれらの異なる空間間の言語的多様性の尺度を比較し、ソーシャルメディアユーザーが現実世界の人口とどのように一致しているかについて議論する。
論文 参考訳(メタデータ) (2023-08-21T03:54:23Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - Building Dynamic Ontological Models for Place using Social Media Data
from Twitter and Sina Weibo [3.662177902714955]
我々は、ソーシャルメディアデータ(Twitter、Weibo)を使用して、北京、中国、サンディエゴの2つの異なる地域で動的オントロジーモデルを構築しています。
我々は、ジオタグ付きソーシャルメディアデータから地名の種類を特定し、ジオタグ付きポイントの半径のデフォルト探索を比較して分類する。
また,各地名の意味を単語雲のポイントワイド・ミューチュアル・インフォメーション(PMI)スコアを用いて検討した。
論文 参考訳(メタデータ) (2023-03-02T00:33:47Z) - SpaBERT: A Pretrained Language Model from Geographic Data for Geo-Entity
Representation [25.52363878314735]
SpaBERTは、地理空間データ内の隣接するエンティティに基づいた汎用的なジオエンタリティ表現を提供する。
SpaBERTは、マスク付き言語モデリングとマスク付きエンティティ予測タスクで事前訓練されている。
SpaBERTを2つの下流タスク、ジオエンティタイピングとジオエンティリンクに適用する。
論文 参考訳(メタデータ) (2022-10-21T19:42:32Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Measuring Geographic Performance Disparities of Offensive Language
Classifiers [12.545108947857802]
「言語、方言、話題の内容は地域によって異なるのか?」「地域によって異なる場合、モデルのパフォーマンスに影響を及ぼすのか?」
同様に、攻撃的な言語モデルがアフリカ系アメリカ人の英語に偽陽性をもたらすのに対し、モデル性能は各都市の少数人口比と相関しないことを示す。
論文 参考訳(メタデータ) (2022-09-15T15:08:18Z) - SIRI: Spatial Relation Induced Network For Spatial Description
Resolution [64.38872296406211]
言語誘導型ローカライゼーションのための新しい関係誘導型ネットワーク(SIRI)を提案する。
提案手法は,80ピクセルの半径で測定した精度で,最先端手法よりも約24%優れていた。
提案手法は,Touchdownと同じ設定で収集した拡張データセットをうまく一般化する。
論文 参考訳(メタデータ) (2020-10-27T14:04:05Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。