論文の概要: LISTN: Lexicon induction with socio-temporal nuance
- arxiv url: http://arxiv.org/abs/2409.19257v2
- Date: Wed, 11 Dec 2024 21:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 17:01:15.928438
- Title: LISTN: Lexicon induction with socio-temporal nuance
- Title(参考訳): LISTN : 社会時相ニュアンスによる語彙誘導
- Authors: Christine de Kock,
- Abstract要約: 群言語は群力学の重要な記号である。
本稿では,グループ内言語の語彙を誘導する新しい手法を提案する。
オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
- 参考スコア(独自算出の注目度): 5.384630221560811
- License:
- Abstract: In-group language is an important signifier of group dynamics. This paper proposes a novel method for inducing lexicons of in-group language, which incorporates its socio-temporal context. Existing methods for lexicon induction do not capture the evolving nature of in-group language, nor the social structure of the community. Using dynamic word and user embeddings trained on conversations from online anti-women communities, our approach outperforms prior methods for lexicon induction. We develop a test set for the task of lexicon induction and a new lexicon of manosphere language, validated by human experts, which quantifies the relevance of each term to a specific sub-community at a given point in time. Finally, we present novel insights on in-group language which illustrate the utility of this approach.
- Abstract(参考訳): 群言語は群力学の重要な記号である。
本稿では,その社会的・時間的文脈を取り入れた,グループ内言語の語彙を誘導する新しい手法を提案する。
既存の語彙誘導法は、グループ内言語の進化する性質やコミュニティの社会的構造を捉えていない。
オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
本研究では,人的専門家によって検証された,語彙誘導タスクのためのテストセットと,特定の時点の特定のサブコミュニティに対する各用語の関連性を定量的に評価する,新しいマンスフェア言語であるマンスフェア言語を開発する。
最後に,本手法の有用性を示すグループ内言語に関する新たな知見を示す。
関連論文リスト
- Jointly modelling the evolution of community structure and language in online extremist groups [5.384630221560811]
グループ間相互作用は、特定の社会的・時間的文脈内で発生し、コミュニティをモデル化する際に考慮すべきである。
本稿では,コミュニティ構造と言語を時間とともに共同でモデル化する手法を提案し,過激派反女性オンライングループの文脈に応用する。
論文 参考訳(メタデータ) (2024-09-28T05:19:51Z) - How Lexical is Bilingual Lexicon Induction? [1.3610643403050855]
近年の検索・ランクアプローチに語彙情報を追加することで,語彙誘導が向上すると考えられる。
提案手法の有効性を実証し,全言語対で平均2%改善した。
論文 参考訳(メタデータ) (2024-04-05T17:10:33Z) - BabySLM: language-acquisition-friendly benchmark of self-supervised
spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。
語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。
テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-06-02T12:54:38Z) - TalkUp: Paving the Way for Understanding Empowering Language [38.873632974397744]
この研究は言語学と社会心理学の文献から構築され、力のある言語を特徴付けるものを探究する。
われわれは、エンパワーメントのためにラベル付けされたRedditの投稿の新しいデータセットをクラウドソースした。
予備的な分析では、このデータセットが、エンパワーメントと非エンパワーメント言語をキャプチャする言語モデルをトレーニングするために使用できることを示している。
論文 参考訳(メタデータ) (2023-05-23T17:55:34Z) - A Comprehensive Empirical Evaluation of Existing Word Embedding
Approaches [5.065947993017158]
既存の単語埋め込み手法の特徴を概説し,多くの分類タスクについて解析する。
伝統的なアプローチでは、主に単語表現を生成するために行列分解を使い、言語の意味的および構文的規則性をうまく捉えることができない。
一方、ニューラルネットワークに基づくアプローチは、言語の洗練された規則性を捕捉し、生成した単語表現における単語関係を保存することができる。
論文 参考訳(メタデータ) (2023-03-13T15:34:19Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Automatically Identifying Language Family from Acoustic Examples in Low
Resource Scenarios [48.57072884674938]
ディープラーニングを用いて言語類似性を解析する手法を提案する。
すなわち、Willernessデータセットのモデルをトレーニングし、その潜在空間が古典的な言語家族の発見とどのように比較されるかを調べる。
論文 参考訳(メタデータ) (2020-12-01T22:44:42Z) - SLM: Learning a Discourse Language Representation with Sentence
Unshuffling [53.42814722621715]
談話言語表現を学習するための新しい事前学習目的である文レベル言語モデリングを導入する。
本モデルでは,この特徴により,従来のBERTの性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-10-30T13:33:41Z) - A Benchmark for Systematic Generalization in Grounded Language
Understanding [61.432407738682635]
人間は慣れ親しんだ部分から成り立つ不慣れな状況を記述する表現を容易に解釈する。
対照的に、現代のニューラルネットワークは、新しい構成を理解するのに苦労している。
位置言語理解における合成一般化を評価するための新しいベンチマークであるgSCANを導入する。
論文 参考訳(メタデータ) (2020-03-11T08:40:15Z) - A Common Semantic Space for Monolingual and Cross-Lingual
Meta-Embeddings [10.871587311621974]
本稿では,モノリンガルおよびクロスリンガルなメタ埋め込みを作成するための新しい手法を提案する。
既存のワードベクトルは線形変換と平均化を用いて共通の意味空間に投影される。
結果として得られる言語間メタ埋め込みは、優れた言語間移動学習能力を示す。
論文 参考訳(メタデータ) (2020-01-17T15:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。