論文の概要: Large-scale Gender/Age Prediction of Tumblr Users
- arxiv url: http://arxiv.org/abs/2001.00594v1
- Date: Thu, 2 Jan 2020 19:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 04:02:27.652104
- Title: Large-scale Gender/Age Prediction of Tumblr Users
- Title(参考訳): Tumblr利用者の大規模ジェンダー・エイジ予測
- Authors: Yao Zhan, Changwei Hu, Yifan Hu, Tejaswi Kasturi, Shanmugam Ramasamy,
Matt Gillingham, Keith Yamamoto
- Abstract要約: 年齢・性別予測のためのグラフベースおよび深層学習モデルを提案する。
グラフベースモデルでは,ネットワーク埋め込みとラベル伝搬という2つのアプローチで接続特性を生成する。
ディープラーニングモデルでは、畳み込みニューラルネットワーク(CNN)と多層パーセプトロン(MLP)を利用して、ユーザの年齢と性別を予測する。
- 参考スコア(独自算出の注目度): 5.063421139422184
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tumblr, as a leading content provider and social media, attracts 371 million
monthly visits, 280 million blogs and 53.3 million daily posts. The popularity
of Tumblr provides great opportunities for advertisers to promote their
products through sponsored posts. However, it is a challenging task to target
specific demographic groups for ads, since Tumblr does not require user
information like gender and ages during their registration. Hence, to promote
ad targeting, it is essential to predict user's demography using rich content
such as posts, images and social connections. In this paper, we propose graph
based and deep learning models for age and gender predictions, which take into
account user activities and content features. For graph based models, we come
up with two approaches, network embedding and label propagation, to generate
connection features as well as directly infer user's demography. For deep
learning models, we leverage convolutional neural network (CNN) and multilayer
perceptron (MLP) to prediction users' age and gender. Experimental results on
real Tumblr daily dataset, with hundreds of millions of active users and
billions of following relations, demonstrate that our approaches significantly
outperform the baseline model, by improving the accuracy relatively by 81% for
age, and the AUC and accuracy by 5\% for gender.
- Abstract(参考訳): tumblrは、主要なコンテンツプロバイダーおよびソーシャルメディアとして、3億3100万の月間訪問、2億8000万のブログ、そして5330万の毎日の投稿を集めている。
tumblrの人気は、広告主がスポンサード投稿を通じて商品を宣伝する絶好の機会を提供する。
しかし、Tumblrは登録時に性別や年齢などのユーザー情報を必要としないため、特定の層グループを対象に広告をターゲットするのは難しい。
したがって、広告ターゲティングを促進するためには、投稿、画像、ソーシャルコネクションといったリッチコンテンツを用いて、ユーザのデモグラフィを予測することが不可欠である。
本稿では,ユーザの行動やコンテンツの特徴を考慮に入れた,年齢・性別予測のためのグラフベースおよび深層学習モデルを提案する。
グラフベースのモデルでは、ネットワーク埋め込みとラベル伝搬という2つのアプローチを考案し、接続機能を生成し、ユーザのデモグラフィを直接推測する。
深層学習モデルでは,畳み込みニューラルネットワーク(cnn)と多層パーセプトロン(mlp)を用いて,ユーザの年齢と性別を予測する。
Tumblrの日々の実際のデータセットにおいて、数億人のアクティブユーザと数十億人のフォロー関係を持つ実験結果から、我々のアプローチは、年齢の精度を81%、性別の精度を56%向上させることで、ベースラインモデルを大幅に上回ることを示した。
関連論文リスト
- GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models via Counterfactual Probing [72.0343083866144]
本稿では,GenderBias-emphVLベンチマークを用いて,大規模視覚言語モデルにおける職業関連性バイアスの評価を行う。
ベンチマークを用いて15のオープンソースLVLMと最先端の商用APIを広範囲に評価した。
既存のLVLMでは男女差が広くみられた。
論文 参考訳(メタデータ) (2024-06-30T05:55:15Z) - DADIT: A Dataset for Demographic Classification of Italian Twitter Users
and a Comparison of Prediction Methods [20.590525489367955]
イタリアで20万のTwitterユーザーの3000万ツイートのDADITデータセットを構築し、検証し、公開します。
DADITは、ソーシャルメディア利用者の性別や年齢を予測するために、様々な最先端モデルの性能を訓練し比較することを可能にする。
論文 参考訳(メタデータ) (2024-03-08T22:18:13Z) - Auditing Gender Presentation Differences in Text-to-Image Models [54.16959473093973]
我々は、テキスト・ツー・イメージ・モデルにおいて、ジェンダーがどのように異なる形で提示されるかを研究する。
入力テキスト中の性指標を探索することにより、プレゼンテーション中心属性の周波数差を定量化する。
このような違いを推定する自動手法を提案する。
論文 参考訳(メタデータ) (2023-02-07T18:52:22Z) - Twitter-Based Gender Recognition Using Transformers [2.539920413471809]
画像やつぶやきからユーザの性別を予測するためのトランスフォーマーに基づくモデルを提案する。
そこで我々は,2方向変換(ViTBERT)に基づく別のモデルを微調整し,ユーザの性別をつぶやきで認識する。
組み合わせモデルは画像分類モデルとテキスト分類モデルの精度をそれぞれ6.98%と4.43%改善する。
論文 参考訳(メタデータ) (2022-04-24T19:58:42Z) - DALL-Eval: Probing the Reasoning Skills and Social Biases of
Text-to-Image Generation Models [73.12069620086311]
テキスト・ツー・イメージ・モデルの視覚的推論能力と社会的バイアスについて検討する。
まず,物体認識,物体カウント,空間的関係理解という3つの視覚的推論スキルを計測する。
第2に、生成した画像の性別/肌の色調分布を測定することにより、性別と肌のトーンバイアスを評価する。
論文 参考訳(メタデータ) (2022-02-08T18:36:52Z) - What's in a Name? -- Gender Classification of Names with Character Based
Machine Learning Models [6.805167389805055]
本稿では,登録ユーザの性別を宣言された名前に基づいて予測する問題を考察する。
1億人以上の利用者のファーストネームを分析したところ、性別は名前文字列の合成によって非常に効果的に分類できることがわかった。
論文 参考訳(メタデータ) (2021-02-07T01:01:32Z) - Gender prediction using limited Twitter Data [0.0]
本稿では,ソーシャルメディア上でのジェンダー予測におけるBERT(単語埋め込み用トランスフォーマーモデル)の有用性について検討する。
オランダのBERTモデルは、性別をラベル付けしたオランダのTwitterデータセットの異なるサンプルに基づいて微調整される。
その結果、比較的少量のデータであっても、BERTを微調整してTwitterユーザーの性別を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2020-09-29T11:46:07Z) - Disentangled Graph Collaborative Filtering [100.26835145396782]
Disentangled Graph Collaborative Filtering (DGCF)は、インタラクションデータからユーザとアイテムの情報表現を学ぶための新しいモデルである。
ユーザ・イテムのインタラクション毎に意図を超越した分布をモデル化することにより、インテント・アウェアなインタラクショングラフと表現を反復的に洗練する。
DGCFはNGCF、DisenGCN、MacridVAEといった最先端モデルよりも大幅に改善されている。
論文 参考訳(メタデータ) (2020-07-03T15:37:25Z) - Mitigating Gender Bias in Captioning Systems [56.25457065032423]
ほとんどのキャプションモデルは性別バイアスを学習し、特に女性にとって高い性別予測エラーにつながる。
本稿では, 視覚的注意を自己指導し, 正しい性的な視覚的証拠を捉えるためのガイド付き注意画像キャプチャーモデル(GAIC)を提案する。
論文 参考訳(メタデータ) (2020-06-15T12:16:19Z) - Investigating Bias in Deep Face Analysis: The KANFace Dataset and
Empirical Study [67.3961439193994]
現在までに最も包括的で大規模な顔画像とビデオのデータセットを導入している。
データは、アイデンティティ、正確な年齢、性別、親族関係の点で手動で注釈付けされる。
提案したベンチマークでネットワーク埋め込みをデバイアス化する手法を導入し,テストした。
論文 参考訳(メタデータ) (2020-05-15T00:14:39Z) - PANDORA Talks: Personality and Demographics on Reddit [2.4149105714758545]
Redditコメントの最初の大規模データセットであるPANDORAを10万以上のユーザー向けに3つのパーソナリティモデルと人口統計モデルでラベル付けした。
3つの実験でこのデータセットの有用性を示し、より容易に利用できるデータを活用してBig 5の特徴を予測する。
人格および人口統計変数のベンチマーク予測モデルを提案する。
論文 参考訳(メタデータ) (2020-04-09T10:08:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。