論文の概要: DiPD: Disruptive event Prediction Dataset from Twitter
- arxiv url: http://arxiv.org/abs/2111.15629v1
- Date: Thu, 25 Nov 2021 13:16:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 00:44:07.776761
- Title: DiPD: Disruptive event Prediction Dataset from Twitter
- Title(参考訳): DiPD:Twitterのディスラプティブイベント予測データセット
- Authors: Sanskar Soni, Dev Mehta, Vinush Vishwanath, Aditi Seetha and Satyendra
Singh Chouhan
- Abstract要約: 暴動や抗議活動は、もし制御不能になったとしても、ある国で憎悪を引き起こす可能性がある。
このデータセットは、過去または進行中のイベントのつぶやきを収集する。
94855件の記録と168706件の記録がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Riots and protests, if gone out of control, can cause havoc in a country. We
have seen examples of this, such as the BLM movement, climate strikes, CAA
Movement, and many more, which caused disruption to a large extent. Our motive
behind creating this dataset was to use it to develop machine learning systems
that can give its users insight into the trending events going on and alert
them about the events that could lead to disruption in the nation. If any event
starts going out of control, it can be handled and mitigated by monitoring it
before the matter escalates. This dataset collects tweets of past or ongoing
events known to have caused disruption and labels these tweets as 1. We also
collect tweets that are considered non-eventful and label them as 0 so that
they can also be used to train a classification system. The dataset contains
94855 records of unique events and 168706 records of unique non-events, thus
giving the total dataset 263561 records. We extract multiple features from the
tweets, such as the user's follower count and the user's location, to
understand the impact and reach of the tweets. This dataset might be useful in
various event related machine learning problems such as event classification,
event recognition, and so on.
- Abstract(参考訳): 暴動や抗議は、もし制御不能になったら、ある国で大混乱を引き起こす可能性がある。
我々は、blm運動、気候ストライキ、caa運動など、多くの例を見てきたが、これは大きな混乱を引き起こした。
このデータセットを作成する動機は、機械学習システムを開発することで、ユーザが現在起きているトレンドイベントについて洞察し、国内の混乱につながる可能性のあるイベントについて警告することです。
何らかのイベントが制御不能になり始めると、事態がエスカレートする前に監視することで処理と緩和が可能である。
このデータセットは、過去のまたは進行中のイベントのツイートを収集し、これらのツイートを1.1にラベル付けする。
また、不都合と思われるツイートを収集し、それらを0としてラベル付けすることで、分類システムのトレーニングにも使用できる。
データセットには、94855のユニークなイベントの記録と168706のユニークな非イベントの記録が含まれている。
我々は、ツイートの影響と到達度を理解するために、ユーザのフォロワー数やユーザの位置情報など、ツイートから複数の特徴を抽出する。
このデータセットは、イベント分類やイベント認識など、さまざまなイベント関連機械学習問題に有用かもしれない。
関連論文リスト
- Master of Disaster: A Disaster-Related Event Monitoring System From News Streams [6.731053352452566]
災害関連イベント監視システムの必要性は、重大災害の増加による社会的・経済的影響によるものである。
我々は,ニュースストリームを受信し,イベント情報を抽出し,抽出した情報を知識グラフ(KG)にリンクし,イベントインスタンスを視覚的に識別する,オープンソースのイベント監視システムであるMaster of Disaster(MoD)を実証する。
論文 参考訳(メタデータ) (2024-06-13T17:01:28Z) - Improving Event Definition Following For Zero-Shot Event Detection [66.27883872707523]
ゼロショットイベント検出に対する既存のアプローチは通常、既知のイベントタイプをアノテートしたデータセット上でモデルをトレーニングする。
イベント定義に従うためのトレーニングモデルによるゼロショットイベント検出の改善を目指しています。
論文 参考訳(メタデータ) (2024-03-05T01:46:50Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Manipulating Twitter Through Deletions [64.33261764633504]
Twitter上でのインフルエンスキャンペーンの研究は、公開APIを通じて得られたツイートから悪意のあるアクティビティを識別することに大きく依存している。
ここでは,1100万以上のアカウントによる10億以上の削除を含む,異常な削除パターンを網羅的かつ大規模に分析する。
少数のアカウントが毎日大量のツイートを削除していることがわかった。
まず、ツイートのボリューム制限が回避され、特定のアカウントが毎日2600万以上のツイートをネットワークに流すことができる。
第二に、調整されたアカウントのネットワークは、繰り返しのいいね!や、最終的に削除されるコンテンツとは違って、ランキングアルゴリズムを操作できる。
論文 参考訳(メタデータ) (2022-03-25T20:07:08Z) - Traffic Event Detection as a Slot Filling Problem [18.61490760235035]
ベルギーとブリュッセルの2つの(構築された)交通関連データセットを公開することにより、Twitterストリームからきめ細かいトラフィック情報を抽出する新たな問題を紹介した。
本稿では,2つのサブタスクを別々に,あるいは共同で処理するいくつかの手法を提案するとともに,交通事象検出問題に対する提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2021-09-13T15:02:40Z) - On Informative Tweet Identification For Tracking Mass Events [0.0]
本研究では,対象イベントに関連するツイートを自動的に識別する機械学習手法について検討する。
本稿では,手作り機能と自動学習機能の両方を活用するハイブリッドモデルを提案する。
実世界の出来事の大規模なデータセットに関する実験により、後者のアプローチは前者よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2021-01-14T15:10:42Z) - Unsupervised Label-aware Event Trigger and Argument Classification [73.86358632937372]
まず,利用可能なツール(srlなど)でイベントを識別し,それを事前に定義されたイベントタイプに自動マップする,教師なしイベント抽出パイプラインを提案する。
事前訓練された言語モデルを利用して、イベントトリガと引数の両方の事前定義された型を文脈的に表現します。
我々は、トリガーの83%と引数の54%を正しい型にマッピングし、以前のゼロショットアプローチのパフォーマンスをほぼ倍にしました。
論文 参考訳(メタデータ) (2020-12-30T17:47:24Z) - Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets [0.0]
We describe our system entry for WNUT 2020 Shared Task-3。
このタスクは、TwitterからさまざまなCOVID-19関連イベントの抽出を自動化することを目的としていた。
このシステムは、アンサンブルや追加のデータセットを使用せずに、F1の0.6598でリーダーボードで1位にランクインします。
論文 参考訳(メタデータ) (2020-12-18T04:49:32Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - On Identifying Hashtags in Disaster Twitter Data [55.17975121160699]
我々は,行動可能な情報をフィルタリングするのに有用なハッシュタグを付加した災害関連ツイートのユニークなデータセットを構築した。
このデータセットを用いて,マルチタスク学習フレームワークにおける長期記憶モデルについて検討する。
最高のパフォーマンスモデルでは、F1スコアは92.22%に達する。
論文 参考訳(メタデータ) (2020-01-05T22:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。