Fugu-MT 論文翻訳(概要): LISTN: Lexicon induction with socio-temporal nuance

論文の概要: LISTN: Lexicon induction with socio-temporal nuance

arxiv url: http://arxiv.org/abs/2409.19257v2
Date: Wed, 11 Dec 2024 21:21:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-13 15:57:55.862747
Title: LISTN: Lexicon induction with socio-temporal nuance
Title（参考訳）: LISTN : 社会時相ニュアンスによる語彙誘導
Authors: Christine de Kock,
Abstract要約: 群言語は群力学の重要な記号である。本稿では,グループ内言語の語彙を誘導する新しい手法を提案する。オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。
参考スコア（独自算出の注目度）: 5.384630221560811
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In-group language is an important signifier of group dynamics. This paper proposes a novel method for inducing lexicons of in-group language, which incorporates its socio-temporal context. Existing methods for lexicon induction do not capture the evolving nature of in-group language, nor the social structure of the community. Using dynamic word and user embeddings trained on conversations from online anti-women communities, our approach outperforms prior methods for lexicon induction. We develop a test set for the task of lexicon induction and a new lexicon of manosphere language, validated by human experts, which quantifies the relevance of each term to a specific sub-community at a given point in time. Finally, we present novel insights on in-group language which illustrate the utility of this approach.
Abstract（参考訳）: 群言語は群力学の重要な記号である。本稿では,その社会的・時間的文脈を取り入れた,グループ内言語の語彙を誘導する新しい手法を提案する。既存の語彙誘導法は、グループ内言語の進化する性質やコミュニティの社会的構造を捉えていない。オンラインの反女性コミュニティの会話で訓練された動的単語とユーザ埋め込みを用いて、我々のアプローチは、レキシコン誘導の先行手法よりも優れている。本研究では,人的専門家によって検証された,語彙誘導タスクのためのテストセットと,特定の時点の特定のサブコミュニティに対する各用語の関連性を定量的に評価する,新しいマンスフェア言語であるマンスフェア言語を開発する。最後に,本手法の有用性を示すグループ内言語に関する新たな知見を示す。

関連論文リスト

Dialect Normalization using Large Language Models and Morphological Rules [23.750564623399253]
本稿では,ルールベースの言語情報変換と大規模言語モデル(LLM)と,目的とする複数ショットプロンプトを組み合わせた新しい正規化手法を提案する。我々は,ギリシャ語の方言の手法を実装し,それを地域証明のデータセットに適用し,人間のアノテータを用いたアウトプットの評価を行った。次に、このデータセットを用いて下流実験を行い、これらの証明に関する以前の結果は、表面的な言語情報にのみ依存していることを発見した。
論文参考訳（メタデータ） (2025-06-10T15:34:34Z)
Jointly modelling the evolution of community structure and language in online extremist groups [5.384630221560811]
グループ間相互作用は、特定の社会的・時間的文脈内で発生し、コミュニティをモデル化する際に考慮すべきである。本稿では,コミュニティ構造と言語を時間とともに共同でモデル化する手法を提案し,過激派反女性オンライングループの文脈に応用する。
論文参考訳（メタデータ） (2024-09-28T05:19:51Z)
Inclusivity in Large Language Models: Personality Traits and Gender Bias in Scientific Abstracts [49.97673761305336]
我々は,3つの大きな言語モデル (LLM) を,人間の物語スタイルと潜在的な性別バイアスに適合させることで評価した。以上の結果から,これらのモデルは一般的にヒトの投稿内容によく似たテキストを生成するが,スタイル的特徴の変化は有意な性差を示すことが示唆された。
論文参考訳（メタデータ） (2024-06-27T19:26:11Z)
How Lexical is Bilingual Lexicon Induction? [1.3610643403050855]
近年の検索・ランクアプローチに語彙情報を追加することで,語彙誘導が向上すると考えられる。提案手法の有効性を実証し,全言語対で平均2%改善した。
論文参考訳（メタデータ） (2024-04-05T17:10:33Z)
Neural Conversation Models and How to Rein Them in: A Survey of Failures and Fixes [17.489075240435348]
最近の条件付き言語モデルは、しばしば流動的な方法で、あらゆる種類のテキストソースを継続することができる。言語の観点から言えば、会話への貢献は高い。最近のアプローチでは、基礎となる言語モデルを様々な介入ポイントでテームしようと試みている。
論文参考訳（メタデータ） (2023-08-11T12:07:45Z)
BabySLM: language-acquisition-friendly benchmark of self-supervised spoken language models [56.93604813379634]
音声表現を学習するための自己指導技術は、人間のラベルを必要とせずに、音声への露出から言語能力を高めることが示されている。語彙および構文レベルで音声言語モデルを探索するために,言語習得に親しみやすいベンチマークを提案する。テキストと音声のギャップを埋めることと、クリーンな音声とその内話のギャップを埋めることである。
論文参考訳（メタデータ） (2023-06-02T12:54:38Z)
TalkUp: Paving the Way for Understanding Empowering Language [38.873632974397744]
この研究は言語学と社会心理学の文献から構築され、力のある言語を特徴付けるものを探究する。われわれは、エンパワーメントのためにラベル付けされたRedditの投稿の新しいデータセットをクラウドソースした。予備的な分析では、このデータセットが、エンパワーメントと非エンパワーメント言語をキャプチャする言語モデルをトレーニングするために使用できることを示している。
論文参考訳（メタデータ） (2023-05-23T17:55:34Z)
A Comprehensive Empirical Evaluation of Existing Word Embedding Approaches [5.065947993017158]
既存の単語埋め込み手法の特徴を概説し,多くの分類タスクについて解析する。伝統的なアプローチでは、主に単語表現を生成するために行列分解を使い、言語の意味的および構文的規則性をうまく捉えることができない。一方、ニューラルネットワークに基づくアプローチは、言語の洗練された規則性を捕捉し、生成した単語表現における単語関係を保存することができる。
論文参考訳（メタデータ） (2023-03-13T15:34:19Z)
Unsupervised Lexical Substitution with Decontextualised Embeddings [48.00929769805882]
事前学習された言語モデルを用いた語彙置換の新しい教師なし手法を提案する。本手法は,文脈的および非文脈的単語埋め込みの類似性に基づいて代用語を検索する。我々は、英語とイタリア語で実験を行い、我々の手法が強いベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2022-09-17T03:51:47Z)
LexSubCon: Integrating Knowledge from Lexical Resources into Contextual Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2021-07-11T21:25:56Z)
Characterizing English Variation across Social Media Communities with BERT [9.98785450861229]
474のRedditコミュニティで2ヶ月の英語コメントを分析した。コミュニティに異なる感覚のクラスタの特異性は、コミュニティのユニークな単語タイプの特異性と組み合わさって、社会グループの言語が規範から逸脱するケースを特定するために使用されます。高度に識別された言語を持つコミュニティは中規模であり、忠実で熱心なユーザは密集したネットワークで交流する。
論文参考訳（メタデータ） (2021-02-12T23:50:57Z)
Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文参考訳（メタデータ） (2020-12-10T01:27:24Z)
Automatically Identifying Language Family from Acoustic Examples in Low Resource Scenarios [48.57072884674938]
ディープラーニングを用いて言語類似性を解析する手法を提案する。すなわち、Willernessデータセットのモデルをトレーニングし、その潜在空間が古典的な言語家族の発見とどのように比較されるかを調べる。
論文参考訳（メタデータ） (2020-12-01T22:44:42Z)
SLM: Learning a Discourse Language Representation with Sentence Unshuffling [53.42814722621715]
談話言語表現を学習するための新しい事前学習目的である文レベル言語モデリングを導入する。本モデルでは,この特徴により,従来のBERTの性能が大幅に向上することを示す。
論文参考訳（メタデータ） (2020-10-30T13:33:41Z)
Towards Debiasing Sentence Representations [109.70181221796469]
Sent-Debiasはバイアスを取り除くのに有効であり、同時に文レベルの下流タスクのパフォーマンスを保っていることを示す。我々は、より公平なNLPのための広く採用されている文表現から社会的偏見を識別・除去する今後の研究に刺激を与えることを期待している。
論文参考訳（メタデータ） (2020-07-16T04:22:30Z)
Analysing Lexical Semantic Change with Contextualised Word Representations [7.071298726856781]
本稿では,BERTニューラルネットワークモデルを用いて単語使用率の表現を求める手法を提案する。我々は新しい評価データセットを作成し、モデル表現と検出された意味変化が人間の判断と正に相関していることを示す。
論文参考訳（メタデータ） (2020-04-29T12:18:14Z)
A Benchmark for Systematic Generalization in Grounded Language Understanding [61.432407738682635]
人間は慣れ親しんだ部分から成り立つ不慣れな状況を記述する表現を容易に解釈する。対照的に、現代のニューラルネットワークは、新しい構成を理解するのに苦労している。位置言語理解における合成一般化を評価するための新しいベンチマークであるgSCANを導入する。
論文参考訳（メタデータ） (2020-03-11T08:40:15Z)
A Common Semantic Space for Monolingual and Cross-Lingual Meta-Embeddings [10.871587311621974]
本稿では,モノリンガルおよびクロスリンガルなメタ埋め込みを作成するための新しい手法を提案する。既存のワードベクトルは線形変換と平均化を用いて共通の意味空間に投影される。結果として得られる言語間メタ埋め込みは、優れた言語間移動学習能力を示す。
論文参考訳（メタデータ） (2020-01-17T15:42:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。