論文の概要: Real-Time Summarization of Twitter
- arxiv url: http://arxiv.org/abs/2407.08125v1
- Date: Thu, 11 Jul 2024 01:56:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 19:18:18.596887
- Title: Real-Time Summarization of Twitter
- Title(参考訳): Twitterのリアルタイム要約
- Authors: Yixin Jin, Meiqi Wang, Meng Li, Wenjing Zhou, Yi Shen, Hao Liu,
- Abstract要約: 我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、特定の興味のあるプロフィールに関連するつぶやきを返す必要がある。
ツイートが特定の関心プロファイルに関連するかどうかを分類するために、Dirichletスコアと、非常にスムーズな(ベースライン)で採用しています。
また、プッシュキューから冗長なツイートを削除することも望まれる。
- 参考スコア(独自算出の注目度): 9.034423337410274
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we describe our approaches to TREC Real-Time Summarization of Twitter. We focus on real time push notification scenario, which requires a system monitors the stream of sampled tweets and returns the tweets relevant and novel to given interest profiles. Dirichlet score with and with very little smoothing (baseline) are employed to classify whether a tweet is relevant to a given interest profile. Using metrics including Mean Average Precision (MAP, cumulative gain (CG) and discount cumulative gain (DCG), the experiment indicates that our approach has a good performance. It is also desired to remove the redundant tweets from the pushing queue. Due to the precision limit, we only describe the algorithm in this paper.
- Abstract(参考訳): 本稿では,Twitter のリアルタイム要約における TREC のアプローチについて述べる。
我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、関連するツイートと新規なツイートを、特定の興味のあるプロフィールに返却する。
ダイリクレスコア(ダイリクレスコア)は、非常にスムーズな(ベースライン)で、あるツイートが特定の関心プロファイルに関連するかどうかを分類するために使用される。
平均利得(MAP),累積利得(CG),ディスカウント累積利得(DCG)などの指標を用いて,本手法が良好な性能を示すことを示す。
また、プッシュキューから冗長なツイートを削除することも望まれる。
精度の限界のため,本論文ではアルゴリズムについてのみ記述する。
関連論文リスト
- Less is More: One-shot Subgraph Reasoning on Large-scale Knowledge Graphs [49.547988001231424]
効率的かつ適応的な予測を実現するために,ワンショットサブグラフリンク予測を提案する。
設計原理は、KG全体に直接作用する代わりに、予測手順を2つのステップに分離する。
5つの大規模ベンチマークにおいて,効率の向上と性能の向上を実現している。
論文 参考訳(メタデータ) (2024-03-15T12:00:12Z) - Context-Based Tweet Engagement Prediction [0.0]
この論文は、ツイートのエンゲージメントの可能性を予測するために、コンテキスト単独がいかにうまく使われるかを調査する。
私たちはTU WienのLittle Big Data ClusterにSparkエンジンを使用して、スケーラブルなデータ前処理、機能エンジニアリング、機能選択、マシンラーニングパイプラインを作成しました。
また, 予測アルゴリズム, トレーニングデータセットサイズ, トレーニングデータセットサンプリング手法, 特徴選択などの因子が, 結果に有意な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-09-28T08:36:57Z) - Towards Detecting Inauthentic Coordination in Twitter Likes Data [0.0]
ユーザーはカスタムに、品質と権威の中立的なプロキシとして、いいね!などのエンゲージメントのメトリクスを取る。
これは、操作のようなインセンティブを、*コーディネートされた非正当性行動*(CIB)を通じて、世論に影響を与える。
いいね!をターゲットとしたCIBは、ユーザの好みの行動に関する適切なデータを集めることは簡単ではないため、ほとんど研究されていない。
本稿は,Twitterから適切な嗜好データを集めるためのスクリプトアルゴリズムと,デンマークの政治ツイッタースフィア#dkpolからの好意データを集めた30日間のデータセットをコントリビュートする。
論文 参考訳(メタデータ) (2023-05-12T11:24:26Z) - LaPraDoR: Unsupervised Pretrained Dense Retriever for Zero-Shot Text
Retrieval [55.097573036580066]
実験結果から,LaPraDoRは教師付き高密度検索モデルと比較して最先端の性能が得られることがわかった。
再ランクと比較すると,1ミリ秒 (22.5倍高速) でレキシコン強化手法を動作させることができるが,性能は良好である。
論文 参考訳(メタデータ) (2022-03-11T18:53:12Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Smart Crawling: A New Approach toward Focus Crawling from Twitter [0.10312968200748115]
TwitterデータはREST APIを使ってアクセスすることができる。
SmartTwitter Crawling(STiC)は、ターゲットトピックに関連する一連のツイートを検索する。
論文 参考訳(メタデータ) (2021-10-08T11:04:49Z) - A Case Study to Reveal if an Area of Interest has a Trend in Ongoing
Tweets Using Word and Sentence Embeddings [0.0]
我々は、デイリー平均類似度スコアが日々のツイートコーパスとターゲット語との類似性を示す、容易に適用可能な自動化手法を提案する。
デイリー平均類似度スコアは主にコサイン類似度と単語/文埋め込みに基づいている。
また,提案手法を適用しながら単語と文の埋め込みの有効性を比較し,ほぼ同じ結果が得られることを認識した。
論文 参考訳(メタデータ) (2021-10-02T18:44:55Z) - How Will Your Tweet Be Received? Predicting the Sentiment Polarity of
Tweet Replies [3.5263924621989196]
我々は新しいタスクを提案する:与えられたツイートに対する(第一次)応答の主観的な感情を予測する。
私たちは、感情ラベルを手動でアノテートしたツイートと返信の大規模なデータセットであるRETWEETを作成します。
自動ラベル付きデータを使用して、ニューラルネットワークの教師付きトレーニングを行い、元のツイートからの返信感情を予測する。
論文 参考訳(メタデータ) (2021-04-21T13:08:45Z) - A Closer Look at Temporal Sentence Grounding in Videos: Datasets and
Metrics [70.45937234489044]
2つの広く使用されているTSGVデータセット(Charades-STAとActivityNet Captions)を再編成し、トレーニング分割と異なるものにします。
基本的なIoUスコアを校正するために、新しい評価基準「dR@$n$,IoU@$m$」を導入する。
すべての結果は、再編成されたデータセットと新しいメトリクスがTSGVの進捗をよりよく監視できることを示している。
論文 参考訳(メタデータ) (2021-01-22T09:59:30Z) - Road Network Metric Learning for Estimated Time of Arrival [93.0759529610483]
本稿では,ATA(Estimated Time of Arrival)のための道路ネットワークメトリックラーニングフレームワークを提案する。
本研究は,(1)走行時間を予測する主回帰タスク,(2)リンク埋め込みベクトルの品質向上のための補助的計量学習タスクの2つの構成要素から構成される。
提案手法は最先端モデルよりも優れており,その促進は少ないデータでコールドリンクに集中していることを示す。
論文 参考訳(メタデータ) (2020-06-24T04:45:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。