論文の概要: Author2Vec: A Framework for Generating User Embedding
- arxiv url: http://arxiv.org/abs/2003.11627v1
- Date: Tue, 17 Mar 2020 23:31:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:19:25.840140
- Title: Author2Vec: A Framework for Generating User Embedding
- Title(参考訳): Author2Vec: ユーザ埋め込みを生成するフレームワーク
- Authors: Xiaodong Wu, Weizhe Lin, Zhilin Wang, and Elena Rastorgueva
- Abstract要約: 本稿では,エンド・ツー・エンドのニューラルネットワークを用いたユーザ埋め込みシステムである Author2Vec を提案する。
このモデルは、BERTが生成した文表現と、教師なし事前学習目標、著者分類を含む。
Author2Vecは有用なユーザ属性をエンコードし、生成されたユーザ埋め込みは下流の分類タスクでうまく機能する。
- 参考スコア(独自算出の注目度): 5.805785001237604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online forums and social media platforms provide noisy but valuable data
every day. In this paper, we propose a novel end-to-end neural network-based
user embedding system, Author2Vec. The model incorporates sentence
representations generated by BERT (Bidirectional Encoder Representations from
Transformers) with a novel unsupervised pre-training objective, authorship
classification, to produce better user embedding that encodes useful
user-intrinsic properties. This user embedding system was pre-trained on post
data of 10k Reddit users and was analyzed and evaluated on two user
classification benchmarks: depression detection and personality classification,
in which the model proved to outperform traditional count-based and
prediction-based methods. We substantiate that Author2Vec successfully encoded
useful user attributes and the generated user embedding performs well in
downstream classification tasks without further finetuning.
- Abstract(参考訳): オンラインフォーラムやソーシャルメディアプラットフォームは、毎日うるさいが価値のあるデータを提供している。
本稿では,ニューラルネットワークを用いた新しいユーザ埋め込みシステム Author2Vec を提案する。
このモデルはBERT(Bidirectional Encoder Representations from Transformers)によって生成された文表現と、教師なし事前学習対象であるオーサシップ分類を取り入れ、有用なユーザ固有のプロパティをエンコードするより良いユーザ埋め込みを生成する。
このユーザ埋め込みシステムは,10kのRedditユーザのポストデータに基づいて事前学習され,抑うつ検出とパーソナリティ分類という2つのユーザ分類ベンチマークで分析・評価された。
我々は, author2Vec が有用なユーザ属性を符号化し, 生成したユーザ埋め込みが, さらなる微調整を伴わずに下流分類タスクにおいて良好に動作することを示す。
関連論文リスト
- Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - Latent User Intent Modeling for Sequential Recommenders [92.66888409973495]
逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文 参考訳(メタデータ) (2022-11-17T19:00:24Z) - Machine and Deep Learning Applications to Mouse Dynamics for Continuous
User Authentication [0.0]
この記事では,3つの機械学習アルゴリズムとディープラーニングアルゴリズムを使用して,40人のユーザのデータセットを評価することで,これまでの公開作業に基づいています。
トップパフォーマーは1次元畳み込みニューラルネットワークであり、トップ10ユーザーの平均テスト精度は85.73%である。
また, 92.48%のピーク精度に達する人工ニューラルネットワークを用いて, マルチクラス分類についても検討した。
論文 参考訳(メタデータ) (2022-05-26T21:43:59Z) - Class Token and Knowledge Distillation for Multi-head Self-Attention
Speaker Verification Systems [20.55054374525828]
本稿では,ディープニューラルネットワーク(DNN)に基づく話者検証システムの性能向上のための3つの新しいアプローチについて検討する。
まず,クラストークンと呼ばれる学習可能なベクトルを用いて,平均的なグローバルプール機構を置換し,埋め込みを抽出する手法を提案する。
第2に,KD(Knowledge Distillation)哲学を用いて教師と学生のペアのネットワークを訓練するための蒸留表現トークンを追加した。
論文 参考訳(メタデータ) (2021-11-06T09:47:05Z) - PETGEN: Personalized Text Generation Attack on Deep Sequence
Embedding-based Classification Models [9.630961791758168]
悪意のあるユーザは、行動を操作することによって、深い検出モデルを回避することができる。
ここでは、ディープユーザシーケンスの埋め込みに基づく分類モデルに対して、新たな逆攻撃モデルを作成する。
攻撃では、敵は分類器を騙すために新しいポストを生成する。
論文 参考訳(メタデータ) (2021-09-14T15:48:07Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Towards Open-World Recommendation: An Inductive Model-based
Collaborative Filtering Approach [115.76667128325361]
推奨モデルは、基礎となるユーザの関心を効果的に見積もり、将来の行動を予測することができる。
2つの表現モデルを含む帰納的協調フィルタリングフレームワークを提案する。
本モデルでは,限られたトレーニングレーティングと新規の未確認ユーザを対象に,数ショットのユーザに対して有望なレコメンデーションを行う。
論文 参考訳(メタデータ) (2020-07-09T14:31:25Z) - Federated Learning of User Authentication Models [69.93965074814292]
機械学習モデルのプライバシー保護のためのフレームワークであるFederated User Authentication (FedUA)を提案する。
FedUAは、フェデレートされた学習フレームワークを採用して、ユーザが生の入力を共有することなく、共同でモデルをトレーニングできるようにする。
提案手法はプライバシ保護であり,多数のユーザに対してスケーラブルであることを示し,出力層を変更することなく,新たなユーザをトレーニングに追加できるようにした。
論文 参考訳(メタデータ) (2020-07-09T08:04:38Z) - Large-scale Hybrid Approach for Predicting User Satisfaction with
Conversational Agents [28.668681892786264]
ユーザの満足度を測定することは難しい課題であり、大規模な会話エージェントシステムの開発において重要な要素である。
人間のアノテーションに基づくアプローチは簡単に制御できるが、スケールするのは難しい。
新たなアプローチとして,会話エージェントシステムに埋め込まれたフィードバック誘導システムを通じて,ユーザの直接的なフィードバックを収集する手法がある。
論文 参考訳(メタデータ) (2020-05-29T16:29:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。