論文の概要: Characterizing English Variation across Social Media Communities with
BERT
- arxiv url: http://arxiv.org/abs/2102.06820v1
- Date: Fri, 12 Feb 2021 23:50:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:41:57.625523
- Title: Characterizing English Variation across Social Media Communities with
BERT
- Title(参考訳): BERTを用いたソーシャルメディアコミュニティ間の英語変化の特徴付け
- Authors: Li Lucy and David Bamman
- Abstract要約: 474のRedditコミュニティで2ヶ月の英語コメントを分析した。
コミュニティに異なる感覚のクラスタの特異性は、コミュニティのユニークな単語タイプの特異性と組み合わさって、社会グループの言語が規範から逸脱するケースを特定するために使用されます。
高度に識別された言語を持つコミュニティは中規模であり、忠実で熱心なユーザは密集したネットワークで交流する。
- 参考スコア(独自算出の注目度): 9.98785450861229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much previous work characterizing language variation across Internet social
groups has focused on the types of words used by these groups. We extend this
type of study by employing BERT to characterize variation in the senses of
words as well, analyzing two months of English comments in 474 Reddit
communities. The specificity of different sense clusters to a community,
combined with the specificity of a community's unique word types, is used to
identify cases where a social group's language deviates from the norm. We
validate our metrics using user-created glossaries and draw on sociolinguistic
theories to connect language variation with trends in community behavior. We
find that communities with highly distinctive language are medium-sized, and
their loyal and highly engaged users interact in dense networks.
- Abstract(参考訳): インターネット社会グループ間の言語変化を特徴付ける多くの先行研究は、これらのグループで使われる単語の種類に焦点を当ててきた。
本研究は,404 Reddit コミュニティにおける2ヶ月の英語コメントを分析し,単語感覚の変化を特徴付けるために BERT を用いて,このような研究を拡張した。
コミュニティに異なる感覚のクラスタの特異性は、コミュニティのユニークな単語タイプの特異性と組み合わさって、社会グループの言語が規範から逸脱するケースを特定するために使用されます。
利用者が作成した用語集を用いてメトリクスを検証し,社会言語理論を用いて言語変化とコミュニティ行動の傾向を結びつける。
高度に識別された言語を持つコミュニティは中規模であり、忠実で熱心なユーザは密集したネットワークで交流する。
関連論文リスト
- Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - From words to connections: Word use similarity as an honest signal
conducive to employees' digital communication [0.0]
我々は、大企業のネットワーク内通信フォーラムで、1600人近い従業員のコミュニケーションを分析した。
単語使用の類似性は他の言語の特徴やネットワーク位置の類似性よりもはるかに多く、対話の主要因は単語使用の類似性であることがわかった。
この結果から,対象者に応じて言語を慎重に選択し,企業管理者とオンラインコミュニティ管理者の両方に実用的な意味を持つ可能性が示唆された。
論文 参考訳(メタデータ) (2021-11-11T10:32:33Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - How individuals change language [1.2437226707039446]
我々は,多種多様な個人レベルの言語行動を含む,非常に一般的な数学的モデルを導入する。
異なる仮定の下で複数の言語における定冠詞と不定冠詞の実証的な変化の可能性を比較した。
幼児期の言語習得の誤りを主眼とする言語変化の説明は、歴史的データによって非常に弱く支持されている。
論文 参考訳(メタデータ) (2021-04-20T19:02:49Z) - The structure of online social networks modulates the rate of lexical
change [7.4037154707453965]
我々は10年間で4420のオンラインコミュニティで80万以上のネオロジズムを大規模に分析している。
本研究は,Poisson回帰分析と生存分析を用いて,コミュニティのネットワーク構造が語彙変化に重要な役割を果たすことを示す。
論文 参考訳(メタデータ) (2021-04-11T13:06:28Z) - Reinforcement Communication Learning in Different Social Network
Structures [0.8594140167290096]
ソーシャルネットワークのグローバル接続は、共有および対称通信システムにおける集団の収束を促進する。
エージェントの学位は、通信規約の使用の一貫性と逆関係である。
論文 参考訳(メタデータ) (2020-07-19T23:57:30Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Analyzing the Surprising Variability in Word Embedding Stability Across
Languages [46.84861591608146]
本稿では,安定性に関連する言語特性について論じ,それに付随する相関関係,言語性システム,その他の特徴について考察する。
これは、特に言語トレンドの研究に使用する研究において、埋め込み使用に影響を及ぼす。
論文 参考訳(メタデータ) (2020-04-30T15:24:43Z) - Generalizing meanings from partners to populations: Hierarchical
inference supports convention formation on networks [31.07078356126945]
言語慣習の重要な特性は、話者のコミュニティ全体を保持することである。
本稿では,この帰納的問題を解決するための階層型ベイズモデルを提案する。
論文 参考訳(メタデータ) (2020-02-04T19:30:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。