論文の概要: TempoWiC: An Evaluation Benchmark for Detecting Meaning Shift in Social
Media
- arxiv url: http://arxiv.org/abs/2209.07216v1
- Date: Thu, 15 Sep 2022 11:17:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-16 12:40:56.024656
- Title: TempoWiC: An Evaluation Benchmark for Detecting Meaning Shift in Social
Media
- Title(参考訳): TempoWiC:ソーシャルメディアにおける意味変化検出のための評価ベンチマーク
- Authors: Daniel Loureiro, Aminette D'Souza, Areej Nasser Muhajab, Isabella A.
White, Gabriel Wong, Luis Espinosa Anke, Leonardo Neves, Francesco Barbieri,
Jose Camacho-Collados
- Abstract要約: 我々は、ソーシャルメディアベースの意味変化の研究を加速するための新しいベンチマークであるTempoWiCを紹介する。
この結果から,ソーシャルメディアに特化した最近リリースされた言語モデルであっても,TempoWiCは難しいベンチマークであることがわかった。
- 参考スコア(独自算出の注目度): 17.840417362892104
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language evolves over time, and word meaning changes accordingly. This is
especially true in social media, since its dynamic nature leads to faster
semantic shifts, making it challenging for NLP models to deal with new content
and trends. However, the number of datasets and models that specifically
address the dynamic nature of these social platforms is scarce. To bridge this
gap, we present TempoWiC, a new benchmark especially aimed at accelerating
research in social media-based meaning shift. Our results show that TempoWiC is
a challenging benchmark, even for recently-released language models specialized
in social media.
- Abstract(参考訳): 言語は時間とともに進化し、言葉の意味は変化する。
これはソーシャルメディアで特に当てはまる。そのダイナミックな性質は、セマンティックシフトの高速化につながるため、nlpモデルが新しいコンテンツやトレンドを扱うのが難しくなるからだ。
しかし、これらのソーシャルプラットフォームの動的な性質に特に対処するデータセットやモデルの数はほとんどない。
このギャップを埋めるために,ソーシャルメディアに基づく意味シフトの研究を特に加速する,新たなベンチマークであるtempowicを提案する。
この結果から,ソーシャルメディアに特化した最近リリースされた言語モデルであっても,TempoWiCは難しいベンチマークであることがわかった。
関連論文リスト
- A Systematic Analysis on the Temporal Generalization of Language Models in Social Media [12.035331011654078]
本稿では,ソーシャルメディア,特にTwitterの時間的変化に注目した。
本研究では,言語モデル(LM)の性能を時間的シフトで評価するための統一評価手法を提案する。
論文 参考訳(メタデータ) (2024-05-15T05:41:06Z) - SuperTweetEval: A Challenging, Unified and Heterogeneous Benchmark for
Social Media NLP Research [33.698581876383074]
ソーシャルメディアのSuperTweetEvalにおいて,NLP評価のための統一ベンチマークを導入する。
SuperTweetEvalで幅広いモデルのパフォーマンスをベンチマークした結果、最近の言語モデリングの進歩にもかかわらず、ソーシャルメディアは依然として困難な状態にあることが示唆された。
論文 参考訳(メタデータ) (2023-10-23T09:48:25Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Contextualizing Emerging Trends in Financial News Articles [2.9483477138814287]
新型コロナウイルス(COVID-19)パンデミックの開始前後に収集された、Microsoftに関する金融ニュース記事の新興トレンド検出に焦点を当てる。
データセットをアクセス可能にし、キーワードのペア間の類似性のダイナミクスを探索するための強力なベースラインを提案する。
我々は、このパンデミックがMicrosoftに与える影響について、金の標準(Google Trends)と、注目すべき実世界のシナリオについて評価する。
論文 参考訳(メタデータ) (2023-01-20T12:56:52Z) - Time Will Change Things: An Empirical Study on Dynamic Language
Understanding in Social Media Classification [5.075802830306718]
我々は、実験的にソーシャルメディアのNLUを動的に研究し、モデルが過去のデータに基づいてトレーニングされ、将来のテストが行われる。
自動エンコーディングと擬似ラベルが協調して、動的性の最良の堅牢性を示すことを示す。
論文 参考訳(メタデータ) (2022-10-06T12:18:28Z) - SCoT: Sense Clustering over Time: a tool for the analysis of lexical
change [79.80787569986283]
我々は、語彙変化を分析する新しいネットワークベースのツールであるSense Clustering over Time (SCoT)を提示する。
SCoTは、単語の意味を類似した単語の集合として表現する。
危機の意味の変化に関するヨーロッパの研究で、うまく使われてきた」。
論文 参考訳(メタデータ) (2022-03-18T12:04:09Z) - TimeLMs: Diachronic Language Models from Twitter [22.166929118357714]
ダイアクロニックなTwitterデータに特化した言語モデルであるTimeLMを提示する。
本研究では,Twitter を用いた言語モデルによる将来的・非配布的ツイートの処理能力の向上に,継続的な学習戦略が寄与していることを示す。
論文 参考訳(メタデータ) (2022-02-08T12:47:38Z) - The GEM Benchmark: Natural Language Generation, its Evaluation and
Metrics [66.96150429230035]
我々は、自然言語生成(NLG)のための生きたベンチマークであるGEM、その評価、およびメトリクスを紹介する。
ベンチマークの定期的なアップデートにより、NLGの研究はより多言語化され、モデルとともに課題を進化させる。
論文 参考訳(メタデータ) (2021-02-02T18:42:05Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Temporal Common Sense Acquisition with Minimal Supervision [77.8308414884754]
この研究は、時間的常識の明示的で暗黙的な言及を活用する新しいシーケンスモデリング手法を提案する。
本手法は,時間的共通感覚の様々な次元の質予測を行う。
また、時間比較、親子関係、イベントコア参照、時間的QAなど、関連するタスクに対するイベントの表現も生成する。
論文 参考訳(メタデータ) (2020-05-08T22:20:16Z) - I Know Where You Are Coming From: On the Impact of Social Media Sources
on AI Model Performance [79.05613148641018]
我々は、異なるソーシャルネットワークのマルチモーダルデータから学習する際、異なる機械学習モデルの性能について検討する。
最初の実験結果から,ソーシャルネットワークの選択がパフォーマンスに影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2020-02-05T11:10:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。