論文の概要: What Can We Learn From Almost a Decade of Food Tweets
- arxiv url: http://arxiv.org/abs/2007.05194v2
- Date: Tue, 1 Sep 2020 07:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 22:00:35.967637
- Title: What Can We Learn From Almost a Decade of Food Tweets
- Title(参考訳): 食べ物に関する10年近くにわたるツイートから何が学べるか
- Authors: Uga Spro\c{g}is and Mat\=iss Rikters
- Abstract要約: 私たちはラトビアのTwitter Eater Corpusを紹介します。これは、食べ物、飲み物、食事、飲酒に関連する狭い領域における一連のツイートです。
コーパスは8年以上にわたって収集され、200万以上のツイートと有用なデータが含まれている。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present the Latvian Twitter Eater Corpus - a set of tweets in the narrow
domain related to food, drinks, eating and drinking. The corpus has been
collected over time-span of over 8 years and includes over 2 million tweets
entailed with additional useful data. We also separate two sub-corpora of
question and answer tweets and sentiment annotated tweets. We analyse contents
of the corpus and demonstrate use-cases for the sub-corpora by training
domain-specific question-answering and sentiment-analysis models using data
from the corpus.
- Abstract(参考訳): 私たちはラトビアのTwitter Eater Corpusを紹介します。これは、食べ物、飲み物、食事、飲酒に関連する狭い領域における一連のツイートです。
コーパスは8年以上にわたって収集され、200万以上のツイートに追加の有用なデータが含まれている。
また、質問と回答の2つのサブコーポラを、注釈付きツイートと感情を分ける。
コーパスの内容を分析し,コーパスのデータを用いてドメイン固有の質問応答および感情分析モデルを訓練することにより,サブコーパスのユースケースを示す。
関連論文リスト
- TACO -- Twitter Arguments from COnversations [3.887532996081327]
引数マイニングは、情報と推論として表される議論の構造的要素を特定することを目的としている。
TACOは、200の会話全体をカバーする1,814のツイートを利用した、Twitter Argumentsの最初のデータセットです。
われわれのデータによると、Twitterユーザーはインフォームド推論や情報に関する議論をしがちだ。
論文 参考訳(メタデータ) (2024-03-30T16:14:46Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - What goes on inside rumour and non-rumour tweets and their reactions: A
Psycholinguistic Analyses [58.75684238003408]
ソーシャルメディアのテキストの心理言語学的分析は、誤情報を緩和するために意味のある結論を導くのに不可欠である。
本研究は,様々な事象に関する噂の深い心理言語学的分析を行うことによって貢献する。
論文 参考訳(メタデータ) (2021-11-09T07:45:11Z) - The emojification of sentiment on social media: Collection and analysis
of a longitudinal Twitter sentiment dataset [5.528896840956628]
TM-Sentiは、Twitterの感情データセットを大規模に管理し、ツイート数は1億1400万を超えている。
我々は,大規模なエモティコンと絵文字に基づくラベル付き感情分析データセットを組み立てるための方法論を記述し,評価する。
私たちの分析では絵文字のエモティコンへの利用の増加など、興味深い時間的変化が強調されている。
論文 参考訳(メタデータ) (2021-08-31T14:54:46Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - What's in the Box? An Analysis of Undesirable Content in the Common
Crawl Corpus [77.34726150561087]
言語モデルの訓練に広く使用されるコロッサルwebコーパスであるcommon crawlを分析した。
ヘイトスピーチや性的明示的なコンテンツなど、フィルタリング処理後も、好ましくないコンテンツがかなりの量含まれていることがわかりました。
論文 参考訳(メタデータ) (2021-05-06T14:49:43Z) - Towards A Sentiment Analyzer for Low-Resource Languages [0.0]
本研究は,当時盛んに議論されてきた特定のトレンドトピックに対して,ユーザの感情を分析することを目的としている。
2019年のインドネシア大統領選挙で話題になったハッシュタグのtextit#kpujangancurangを使っています。
本研究は,ラピッドマイニングツールを用いて,Twitterデータを生成し,Nieve Bayes,K-Nearest Neighbor,Decision Tree,Multi-Layer Perceptronの分類手法を比較し,Twitterデータの感情を分類する。
論文 参考訳(メタデータ) (2020-11-12T13:50:00Z) - A Python Library for Exploratory Data Analysis on Twitter Data based on
Tokens and Aggregated Origin-Destination Information [1.5299433434194856]
この提案は、2015年12月からTwitterから収集された処理情報の集合を開いて、Twitter上のイベントのマイニングを容易にすることを目的としている。
この出来事は、自然災害、健康問題、人々の移動性など、提案された図書館で追及できる研究に関係している可能性がある。
要約すると、提示されるPythonライブラリは、異なるドメインに適用され、アラビア語、英語、スペイン語、ロシア語の単語の2グラムの単語と2日単位の頻度で情報を取り出す。
論文 参考訳(メタデータ) (2020-09-03T17:44:44Z) - Writer Identification Using Microblogging Texts for Social Media
Forensics [53.180678723280145]
私たちは、文学的分析に広く使われている人気のあるスタイル的特徴と、URL、ハッシュタグ、返信、引用などの特定のTwitter機能を評価します。
我々は、様々なサイズの著者集合と、著者毎のトレーニング/テストテキストの量をテストする。
論文 参考訳(メタデータ) (2020-07-31T00:23:18Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z) - Exploratory Analysis of Covid-19 Tweets using Topic Modeling, UMAP, and
DiGraphs [36.33347149799959]
本稿では,Covid19 ツイートのトピック,キーワード,特徴,情報拡散の速度,ネットワーク行動の5つの異なる評価手法について述べる。
米国のケースに特有なトピックは、ホワイトハウスのコロナウイルス対策部隊のブリーフィングの後すぐに上昇し始めるだろう。
この分析の最も単純な特徴の1つは、正規表現のような初期記述的手法がハイレベルなテーマをうまく識別できることである。
論文 参考訳(メタデータ) (2020-05-06T19:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。