論文の概要: Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models
- arxiv url: http://arxiv.org/abs/2409.17990v1
- Date: Thu, 26 Sep 2024 16:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-28 16:26:02.248130
- Title: Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models
- Title(参考訳): 時空間適応型大規模言語モデルを用いた縦断的ソーシャルメディアデータからの感情集約の抽出
- Authors: Georg Ahnert, Max Pellert, David Garcia, Markus Strohmaier,
- Abstract要約: 本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。
我々は、Llama 3 8BのテンポラルアダプタをイギリスのTwitterユーザーのパネルから全タイムラインで微調整し、確立したアンケートで感情と態度の縦断的な集計を抽出する。
- 参考スコア(独自算出の注目度): 1.9299251284637737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes temporally aligned Large Language Models (LLMs) as a tool for longitudinal analysis of social media data. We fine-tune Temporal Adapters for Llama 3 8B on full timelines from a panel of British Twitter users, and extract longitudinal aggregates of emotions and attitudes with established questionnaires. We validate our estimates against representative British survey data and find strong positive, significant correlations for several collective emotions. The obtained estimates are robust across multiple training seeds and prompt formulations, and in line with collective emotions extracted using a traditional classification model trained on labeled data. To the best of our knowledge, this is the first work to extend the analysis of affect in LLMs to a longitudinal setting through Temporal Adapters. Our work enables new approaches towards the longitudinal analysis of social media data.
- Abstract(参考訳): 本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。
我々は、Llama 3 8BのテンポラルアダプタをイギリスのTwitterユーザーのパネルから全タイムラインで微調整し、確立したアンケートで感情と態度の縦断的な集計を抽出する。
我々は、イギリスの代表的な調査データに対して評価を行い、いくつかの集団感情に対して、強い肯定的、有意な相関関係を見出した。
得られた推定値は、複数の訓練種子と迅速な定式化、およびラベル付きデータに基づいて訓練された伝統的な分類モデルを用いて抽出された集合的感情と整合する。
我々の知る限りでは、LLMにおける影響の分析をテンポラルアダプタを通して縦方向のセッティングに拡張する最初の試みである。
我々の研究は、ソーシャルメディアデータの長手解析への新たなアプローチを可能にする。
関連論文リスト
- Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding [57.62275091656578]
時間的複合イベント(TCE)として、長い期間にわたって多くのニュース記事から構成される複合イベントについて述べる。
本稿では,Large Language Models (LLMs) を用いて,TCE内のイベントチェーンを系統的に抽出し,解析する手法を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:42:17Z) - Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.16137964758612]
大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。
我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文 参考訳(メタデータ) (2024-05-31T20:15:10Z) - Evaluation of Faithfulness Using the Longest Supported Subsequence [52.27522262537075]
本稿では,文脈によって支持される請求項の最長不連続性を計算し,機械生成テキストの忠実さを評価する新しい手法を提案する。
新しい人間アノテーション付きデータセットを使用して、モデルを微調整してLongest Supported Subsequence(LSS)を生成する。
提案手法は,我々のデータセットの忠実度に対する最先端のメトリクスよりも18%向上していることを示す。
論文 参考訳(メタデータ) (2023-08-23T14:18:44Z) - Exploring the Power of Topic Modeling Techniques in Analyzing Customer
Reviews: A Comparative Analysis [0.0]
大量のテキストデータをオンラインで分析するために、機械学習と自然言語処理アルゴリズムがデプロイされている。
本研究では,顧客レビューに特化して用いられる5つのトピックモデリング手法について検討・比較する。
以上の結果から,BERTopicはより意味のあるトピックを抽出し,良好な結果を得ることができた。
論文 参考訳(メタデータ) (2023-08-19T08:18:04Z) - Tweet Insights: A Visualization Platform to Extract Temporal Insights
from Twitter [19.591692602304494]
本稿では,Twitterから得られた時系列データの大規模な収集について紹介する。
このデータは過去5年間に渡り、n-gramの頻度、類似性、感情、トピックの分布の変化を捉えている。
このデータの上に構築されたインタフェースは、時間的分析によって意味の変化を検出し、特徴付けることができる。
論文 参考訳(メタデータ) (2023-08-04T05:39:26Z) - Curating corpora with classifiers: A case study of clean energy sentiment online [0.8192907805418583]
ソーシャルメディア投稿の大規模なコーパスには、幅広い世論が含まれている。
世論調査は、数日や数週間で実施し、世論を下ろすのに費用がかかる。
本稿では,解析用文書の最適コーパスを迅速に選択する手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T18:15:45Z) - Time Series Contrastive Learning with Information-Aware Augmentations [57.45139904366001]
コントラスト学習の鍵となる要素は、いくつかの先行を示唆する適切な拡張を選択して、実現可能な正のサンプルを構築することである。
対照的な学習タスクやデータセットに意味のある時系列データの増大をどうやって見つけるかは、未解決の問題である。
本稿では,時系列表現学習のための最適な拡張を適応的に選択する情報認識拡張を用いた新しいコントラスト学習手法であるInfoTSを提案する。
論文 参考訳(メタデータ) (2023-03-21T15:02:50Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Validating daily social media macroscopes of emotions [0.12656629989060433]
われわれはオンライン新聞で大規模な調査を行い、ユーザーから毎日の情緒的状態の自己報告を収集した。
同じオンラインプラットフォーム上でのユーザディスカッションの感情分析の結果と比較した。
両プラットフォームにおいて,テキスト分析結果と自己報告感情のレベルとの間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2021-08-17T14:28:56Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Learning User Embeddings from Temporal Social Media Data: A Survey [15.324014759254915]
我々は,簡潔な潜在ユーザ表現(a.k.a.)を学習する代表的作業について調査する。
ユーザー埋め込み)は、ソーシャルメディアユーザーの主な特徴を捉えることができる。
学習されたユーザー埋め込みは、その後、パーソナリティモデリング、自殺リスクアセスメント、購買判断予測など、さまざまな下流のユーザー分析タスクをサポートするために使用できます。
論文 参考訳(メタデータ) (2021-05-17T16:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。