論文の概要: Tweet Insights: A Visualization Platform to Extract Temporal Insights
from Twitter
- arxiv url: http://arxiv.org/abs/2308.02142v1
- Date: Fri, 4 Aug 2023 05:39:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-07 13:50:59.568881
- Title: Tweet Insights: A Visualization Platform to Extract Temporal Insights
from Twitter
- Title(参考訳): tweet insights: twitterから時間的洞察を抽出する可視化プラットフォーム
- Authors: Daniel Loureiro and Kiamehr Rezaee and Talayeh Riahi and Francesco
Barbieri and Leonardo Neves and Luis Espinosa Anke and Jose Camacho-Collados
- Abstract要約: 本稿では,Twitterから得られた時系列データの大規模な収集について紹介する。
このデータは過去5年間に渡り、n-gramの頻度、類似性、感情、トピックの分布の変化を捉えている。
このデータの上に構築されたインタフェースは、時間的分析によって意味の変化を検出し、特徴付けることができる。
- 参考スコア(独自算出の注目度): 19.591692602304494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a large collection of time series data derived from
Twitter, postprocessed using word embedding techniques, as well as specialized
fine-tuned language models. This data comprises the past five years and
captures changes in n-gram frequency, similarity, sentiment and topic
distribution. The interface built on top of this data enables temporal analysis
for detecting and characterizing shifts in meaning, including complementary
information to trending metrics, such as sentiment and topic association over
time. We release an online demo for easy experimentation, and we share code and
the underlying aggregated data for future work. In this paper, we also discuss
three case studies unlocked thanks to our platform, showcasing its potential
for temporal linguistic analysis.
- Abstract(参考訳): 本稿では、単語埋め込み技術を用いて後処理したTwitterから派生した時系列データと、特殊な微調整言語モデルを紹介する。
このデータは過去5年間に渡り、n-gram頻度、類似性、感情、トピック分布の変化を捉えている。
このデータの上に構築されたインターフェイスは、感情やトピックの関連といったトレンドメトリクスへの補完的な情報を含む意味の変化を検出し、特徴付けするための時間分析を可能にする。
簡単な実験のためのオンラインデモをリリースし、将来的な作業のためのコードと基盤となる集約データを共有します。
本稿では,我々のプラットフォームのおかげで解錠された3つのケーススタディについても論じ,時間的言語学的分析の可能性を示す。
関連論文リスト
- Metadata Matters for Time Series: Informative Forecasting with Transformers [70.38241681764738]
時系列予測のためのMetaTST(Metadata-informed Time Series Transformer)を提案する。
メタデータの非構造化の性質に取り組むため、MetaTSTは、事前に設計されたテンプレートによってそれらを自然言語に形式化する。
Transformerエンコーダは、メタデータ情報によるシーケンス表現を拡張するシリーズトークンとメタデータトークンの通信に使用される。
論文 参考訳(メタデータ) (2024-10-04T11:37:55Z) - Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models [1.9299251284637737]
本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。
我々は、Llama 3 8BのテンポラルアダプタをイギリスのTwitterユーザーのパネルから全タイムラインで微調整し、確立したアンケートで感情と態度の縦断的な集計を抽出する。
論文 参考訳(メタデータ) (2024-09-26T16:02:00Z) - Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - When a Language Question Is at Stake. A Revisited Approach to Label
Sensitive Content [0.0]
記事では、ロシアとウクライナの戦争を取り上げたウクライナのツイートの例について、疑似ラベル付き機密データのアプローチを再検討する。
得られたデータを統計的に解析し、擬似ラベリングに使用するモデルの評価を行い、さらにそのコーパスの活用方法についてのガイドラインを定めている。
論文 参考訳(メタデータ) (2023-11-17T13:35:10Z) - Pre-trained Language Model with Prompts for Temporal Knowledge Graph
Completion [30.50032335014021]
我々は、新しいTKGCモデル、すなわち、TKGC(PPT)のための Prompts 付き事前学習言語モデルを提案する。
サンプルの四重項を事前訓練した言語モデル入力に変換し、タイムスタンプ間の間隔を異なるプロンプトに変換することで、暗黙的な意味情報を持つ一貫性のある文を生成する。
我々のモデルは、時間的知識グラフからの情報を言語モデルに効果的に組み込むことができる。
論文 参考訳(メタデータ) (2023-05-13T12:53:11Z) - Temporal Attention for Language Models [24.34396762188068]
本稿では,トランスアーキテクチャのキーコンポーネントである自己注意機構を拡張し,時間的注意を喚起する。
時間的注意は、任意のトランスモデルに適用することができ、入力テキストに関連する時間ポイントを添付する必要がある。
我々はこれらの表現を意味変化検出のタスクに活用する。
提案したモデルでは,すべてのデータセットに対して最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-02-04T11:55:34Z) - Time Series Analysis via Network Science: Concepts and Algorithms [62.997667081978825]
本稿では,時系列をネットワークに変換する既存のマッピング手法について概観する。
我々は、主要な概念的アプローチを説明し、権威的な参照を提供し、統一された表記法と言語におけるそれらの利点と限界について洞察を与える。
ごく最近の研究だが、この研究領域には大きな可能性を秘めており、今後の研究の道を開くことを目的としている。
論文 参考訳(メタデータ) (2021-10-11T13:33:18Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - The Paradigm Discovery Problem [121.79963594279893]
我々は、パラダイム発見問題を定式化し、システム判定のためのメトリクスを開発する。
5つの多言語に対する経験的結果について報告する。
私たちのコードとデータは公開されています。
論文 参考訳(メタデータ) (2020-05-04T16:38:54Z) - Human-like Time Series Summaries via Trend Utility Estimation [13.560018516096754]
本稿では,時系列の人間的な記述を生成するためのモデルを提案する。
本システムは時系列データからパターンを見つけ,人間の行動の経験的観察に基づいてこれらのパターンをランク付けする。
本システムの出力は,人間による同じデータの要約に一致させようとする時系列の自然言語記述である。
論文 参考訳(メタデータ) (2020-01-16T06:09:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。