論文の概要: Synerise at RecSys 2021: Twitter user engagement prediction with a fast
neural model
- arxiv url: http://arxiv.org/abs/2109.12985v1
- Date: Thu, 23 Sep 2021 13:51:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:09:12.028418
- Title: Synerise at RecSys 2021: Twitter user engagement prediction with a fast
neural model
- Title(参考訳): recsys 2021でのシナジー:高速なニューラルモデルによるtwitterユーザーのエンゲージメント予測
- Authors: Micha{\l} Daniluk, Jacek D\k{a}browski, Barbara Rychalska, Konrad
Go{\l}uchowski
- Abstract要約: 私たちはTwitterが主催したACM RecSys 2021 Challengeに,第2位のソリューションを提示します。
この課題は、ツイートの集合に対するユーザーのエンゲージメントを予測することであり、10億のデータポイントからなる非常に大きなデータセットを提供する。
単一のツィートエンゲージメント予測の平均推測時間は、64GBメモリを持つ単一のCPUコア上で6msに制限される。
- 参考スコア(独自算出の注目度): 0.745554610293091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present our 2nd place solution to ACM RecSys 2021 Challenge
organized by Twitter. The challenge aims to predict user engagement for a set
of tweets, offering an exceptionally large data set of 1 billion data points
sampled from over four weeks of real Twitter interactions. Each data point
contains multiple sources of information, such as tweet text along with
engagement features, user features, and tweet features. The challenge brings
the problem close to a real production environment by introducing strict
latency constraints in the model evaluation phase: the average inference time
for single tweet engagement prediction is limited to 6ms on a single CPU core
with 64GB memory. Our proposed model relies on extensive feature engineering
performed with methods such as the Efficient Manifold Density Estimator (EMDE)
- our previously introduced algorithm based on Locality Sensitive Hashing
method, and novel Fourier Feature Encoding, among others. In total, we create
numerous features describing a user's Twitter account status and the content of
a tweet. In order to adhere to the strict latency constraints, the underlying
model is a simple residual feed-forward neural network. The system is a
variation of our previous methods which proved successful in KDD Cup 2021, WSDM
Challenge 2021, and SIGIR eCom Challenge 2020. We release the source code at:
https://github.com/Synerise/recsys-challenge-2021
- Abstract(参考訳): 本稿では,Twitterが主催したACM RecSys 2021 Challengeの2位となるソリューションについて紹介する。
この課題は、ツイートの集合に対するユーザーのエンゲージメントを予測することを目的としており、Twitterの実際の4週間の対話から採取された10億データポイントの非常に大きなデータセットを提供する。
各データポイントには、ツイートテキストやエンゲージメント機能、ユーザ機能、ツイート機能など、複数の情報ソースが含まれている。
この課題は、モデル評価フェーズに厳格なレイテンシ制約を導入することで、実際の運用環境に近い問題をもたらす。単一のツイートエンゲージメント予測の平均推論時間は、64GBメモリを持つ単一のCPUコア上で6msに制限される。
提案手法は,局所性に敏感なハッシュ法やフーリエ特徴エンコーディングを基本としたアルゴリズムである,効率的な多様体密度推定器 (emde) を用いた広範な機能工学に依拠している。
合計して、ユーザのTwitterアカウントの状態とツイートの内容を記述する多数の機能を作成します。
厳格なレイテンシ制約に従うために、基礎となるモデルは単純なフィードフォワードニューラルネットワークである。
このシステムは、kdd cup 2021、wsdm challenge 2021、sigir ecom challenge 2020で成功したこれまでの方法の変種である。
ソースコードはhttps://github.com/synerise/recsys-challenge-2021。
関連論文リスト
- Truncated Consistency Models [57.50243901368328]
トレーニング一貫性モデルは、PF ODE 軌道に沿ったすべての中間点を対応するエンドポイントにマッピングする学習を必要とする。
このトレーニングパラダイムが一貫性モデルの1ステップ生成性能を制限することを実証的に見出した。
整合性関数の新しいパラメータ化と2段階の訓練手順を提案し,時間外学習が崩壊することを防ぐ。
論文 参考訳(メタデータ) (2024-10-18T22:38:08Z) - Lightweight Boosting Models for User Response Prediction Using
Adversarial Validation [2.4040470282119983]
ShareChatが主催するACM RecSys Challenge 2023は、アプリがインストールされる確率を予測することを目的としている。
本稿では,この課題に対する軽量な解決策について述べる。
論文 参考訳(メタデータ) (2023-10-05T13:57:05Z) - Context-Based Tweet Engagement Prediction [0.0]
この論文は、ツイートのエンゲージメントの可能性を予測するために、コンテキスト単独がいかにうまく使われるかを調査する。
私たちはTU WienのLittle Big Data ClusterにSparkエンジンを使用して、スケーラブルなデータ前処理、機能エンジニアリング、機能選択、マシンラーニングパイプラインを作成しました。
また, 予測アルゴリズム, トレーニングデータセットサイズ, トレーニングデータセットサンプリング手法, 特徴選択などの因子が, 結果に有意な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2023-09-28T08:36:57Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - Predicting the Geolocation of Tweets Using transformer models on Customized Data [17.55660062746406]
本研究は、ツイート/ユーザ位置情報予測タスクを解決することを目的としている。
提案手法は、自然言語処理のためのニューラルネットワークを実装し、位置を推定する。
提案されたモデルの範囲は、Twitterデータセットで微調整されている。
論文 参考訳(メタデータ) (2023-03-14T12:56:47Z) - Decoder Tuning: Efficient Language Understanding as Decoding [84.68266271483022]
本稿では,タスク固有のデコーダネットワークを出力側で最適化するデコーダチューニング(DecT)を提案する。
勾配ベースの最適化により、DecTは数秒以内にトレーニングでき、サンプル毎に1つのPクエリしか必要としない。
我々は、広範囲にわたる自然言語理解実験を行い、DecTが200ドル以上のスピードアップで最先端のアルゴリズムを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-12-16T11:15:39Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Covid-Transformer: Detecting COVID-19 Trending Topics on Twitter Using
Universal Sentence Encoder [7.305019142196582]
新型コロナウイルス感染症(COVID-19)がパンデミックを引き起こし、世界200カ国以上に感染した。
新型コロナウイルス(COVID-19)の世界的な影響により、ほぼ至る所で人々の大きな関心事となっている。
われわれは、ツイートを分析し、トレンドトピックやTwitter上の人々の関心事を検出する。
論文 参考訳(メタデータ) (2020-09-08T19:00:38Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。