論文の概要: LISTN: Lexicon induction with socio-temporal nuance
- arxiv url: http://arxiv.org/abs/2409.19257v1
- Date: Sat, 28 Sep 2024 06:20:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 00:18:22.563127
- Title: LISTN: Lexicon induction with socio-temporal nuance
- Title(参考訳): LISTN : 社会時相ニュアンスによる語彙誘導
- Authors: Christine de Kock,
- Abstract要約: 本稿では,その社会的・時間的文脈を取り入れた,グループ内レキシコンを誘導する新しい手法を提案する。
オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
本稿では,本手法の有用性を示すグループ内言語に関する新たな知見を示す。
- 参考スコア(独自算出の注目度): 5.384630221560811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Research on extremist online communities frequently utilizes linguistic analysis to explore group dynamics and behaviour. Existing studies often rely on outdated lexicons that do not capture the evolving nature of in-group language, nor the social structure of the community. This paper proposes a novel method for inducing in-group lexicons which incorporates its socio-temporal context. Using dynamic word and user embeddings trained on conversations from online anti-women communities, our approach outperforms prior methods for lexicon induction. We provide a new lexicon of manosphere terms, validated by human experts, which quantifies the relevance of each term to a specific sub-community. We present novel insights on in-group language which illustrate the utility of this approach.
- Abstract(参考訳): 過激派オンラインコミュニティの研究は、しばしば言語分析を利用してグループダイナミクスや行動を探究する。
既存の研究は、しばしば、グループ内言語の進化する性質やコミュニティの社会的構造を捉えない時代遅れのレキシコンに依存している。
本稿では,その社会的・時間的文脈を取り入れた,グループ内レキシコンを誘導する新しい手法を提案する。
オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
人間の専門家によって検証され、各用語の特定のサブコミュニティとの関係を定量化する、新しいマンスフィア用語の辞書を提供する。
本稿では,本手法の有用性を示すグループ内言語に関する新たな知見を示す。
関連論文リスト
- Jointly modelling the evolution of community structure and language in online extremist groups [5.384630221560811]
グループ間相互作用は、特定の社会的・時間的文脈内で発生し、コミュニティをモデル化する際に考慮すべきである。
本稿では,コミュニティ構造と言語を時間とともに共同でモデル化する手法を提案し,過激派反女性オンライングループの文脈に応用する。
論文 参考訳(メタデータ) (2024-09-28T05:19:51Z) - Inclusivity in Large Language Models: Personality Traits and Gender Bias in Scientific Abstracts [49.97673761305336]
我々は,3つの大きな言語モデル (LLM) を,人間の物語スタイルと潜在的な性別バイアスに適合させることで評価した。
以上の結果から,これらのモデルは一般的にヒトの投稿内容によく似たテキストを生成するが,スタイル的特徴の変化は有意な性差を示すことが示唆された。
論文 参考訳(メタデータ) (2024-06-27T19:26:11Z) - Neural Conversation Models and How to Rein Them in: A Survey of Failures
and Fixes [17.489075240435348]
最近の条件付き言語モデルは、しばしば流動的な方法で、あらゆる種類のテキストソースを継続することができる。
言語の観点から言えば、会話への貢献は高い。
最近のアプローチでは、基礎となる言語モデルを様々な介入ポイントでテームしようと試みている。
論文 参考訳(メタデータ) (2023-08-11T12:07:45Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - TalkUp: Paving the Way for Understanding Empowering Language [38.873632974397744]
この研究は言語学と社会心理学の文献から構築され、力のある言語を特徴付けるものを探究する。
われわれは、エンパワーメントのためにラベル付けされたRedditの投稿の新しいデータセットをクラウドソースした。
予備的な分析では、このデータセットが、エンパワーメントと非エンパワーメント言語をキャプチャする言語モデルをトレーニングするために使用できることを示している。
論文 参考訳(メタデータ) (2023-05-23T17:55:34Z) - Unsupervised Lexical Substitution with Decontextualised Embeddings [48.00929769805882]
事前学習された言語モデルを用いた語彙置換の新しい教師なし手法を提案する。
本手法は,文脈的および非文脈的単語埋め込みの類似性に基づいて代用語を検索する。
我々は、英語とイタリア語で実験を行い、我々の手法が強いベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-09-17T03:51:47Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - Characterizing English Variation across Social Media Communities with
BERT [9.98785450861229]
474のRedditコミュニティで2ヶ月の英語コメントを分析した。
コミュニティに異なる感覚のクラスタの特異性は、コミュニティのユニークな単語タイプの特異性と組み合わさって、社会グループの言語が規範から逸脱するケースを特定するために使用されます。
高度に識別された言語を持つコミュニティは中規模であり、忠実で熱心なユーザは密集したネットワークで交流する。
論文 参考訳(メタデータ) (2021-02-12T23:50:57Z) - Towards Debiasing Sentence Representations [109.70181221796469]
Sent-Debiasはバイアスを取り除くのに有効であり、同時に文レベルの下流タスクのパフォーマンスを保っていることを示す。
我々は、より公平なNLPのための広く採用されている文表現から社会的偏見を識別・除去する今後の研究に刺激を与えることを期待している。
論文 参考訳(メタデータ) (2020-07-16T04:22:30Z) - Analysing Lexical Semantic Change with Contextualised Word
Representations [7.071298726856781]
本稿では,BERTニューラルネットワークモデルを用いて単語使用率の表現を求める手法を提案する。
我々は新しい評価データセットを作成し、モデル表現と検出された意味変化が人間の判断と正に相関していることを示す。
論文 参考訳(メタデータ) (2020-04-29T12:18:14Z) - A Benchmark for Systematic Generalization in Grounded Language
Understanding [61.432407738682635]
人間は慣れ親しんだ部分から成り立つ不慣れな状況を記述する表現を容易に解釈する。
対照的に、現代のニューラルネットワークは、新しい構成を理解するのに苦労している。
位置言語理解における合成一般化を評価するための新しいベンチマークであるgSCANを導入する。
論文 参考訳(メタデータ) (2020-03-11T08:40:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。