論文の概要: Personality Profiling: How informative are social media profiles in predicting personal information?
- arxiv url: http://arxiv.org/abs/2309.13065v2
- Date: Sun, 24 Nov 2024 06:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:14:56.916662
- Title: Personality Profiling: How informative are social media profiles in predicting personal information?
- Title(参考訳): パーソナリティ・プロファイリング(Personality Profiling) : ソーシャルメディアのプロフィールは、個人情報の予測にどの程度役立つか?
- Authors: Joshua Watt, Lewis Mitchell, Jonathan Tuke,
- Abstract要約: 我々は、人々のオンラインデジタルフットプリントが、彼らのマイアーズ・ブリッグス・パーソナリティのタイプをプロファイリングできる範囲について調べる。
我々は,ロジスティック回帰,ナイーブベイズ,サポートベクターマシン(SVM),ランダムフォレストという4つのモデルを比較した。
SVMモデルは、完全なパーソナリティの型を予測するために20.95%の精度を達成する。
- 参考スコア(独自算出の注目度): 0.04096453902709291
- License:
- Abstract: Personality profiling has been utilised by companies for targeted advertising, political campaigns and public health campaigns. However, the accuracy and versatility of such models remains relatively unknown. Here we explore the extent to which peoples' online digital footprints can be used to profile their Myers-Briggs personality type. We analyse and compare four models: logistic regression, naive Bayes, support vector machines (SVMs) and random forests. We discover that a SVM model achieves the best accuracy of 20.95% for predicting a complete personality type. However, logistic regression models perform only marginally worse and are significantly faster to train and perform predictions. Moreover, we develop a statistical framework for assessing the importance of different sets of features in our models. We discover some features to be more informative than others in the Intuitive/Sensory (p = 0.032) and Thinking/Feeling (p = 0.019) models. Many labelled datasets present substantial class imbalances of personal characteristics on social media, including our own. We therefore highlight the need for attentive consideration when reporting model performance on such datasets and compare a number of methods to fix class-imbalance problems.
- Abstract(参考訳): パーソナリティ・プロファイリングは、ターゲット広告、政治キャンペーン、公衆衛生キャンペーンのために企業によって利用されてきた。
しかし、そのようなモデルの正確さと汎用性はいまだに不明である。
ここでは、人々のオンラインデジタルフットプリントが、彼らのマイアーズ・ブリッグス・パーソナリティのタイプをプロファイリングできる範囲について調べる。
我々は、ロジスティック回帰、単純ベイズ、サポートベクターマシン(SVM)、ランダムフォレストという4つのモデルを分析し比較する。
我々は,SVMモデルが完全なパーソナリティタイプを予測する上で,20.95%の精度を達成することを発見した。
しかし、ロジスティック回帰モデルの性能はわずかに悪く、予測の訓練と実行が大幅に高速である。
さらに,本モデルにおける特徴集合の重要性を評価するための統計的枠組みを構築した。
Intuitive/Sensory (p = 0.032) モデルや Thinking/Feeling (p = 0.019) モデルでは、いくつかの特徴が他の機能よりも有益であることが分かる。
多くのラベル付きデータセットは、私たち自身のものを含め、ソーシャルメディア上での個人的特性の実質的な階級的不均衡を示す。
したがって、このようなデータセット上でモデル性能を報告する場合、注意すべき考慮の必要性を強調し、クラス不均衡問題を解決するための多くの方法を比較する。
関連論文リスト
- Debiasing Multimodal Models via Causal Information Minimization [65.23982806840182]
我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文 参考訳(メタデータ) (2023-11-28T16:46:14Z) - On the Connection between Pre-training Data Diversity and Fine-tuning
Robustness [66.30369048726145]
下流の有効ロバスト性に影響を与える主な要因はデータ量である。
各種自然および合成データソースから抽出した事前学習分布について,本研究の成果を示す。
論文 参考訳(メタデータ) (2023-07-24T05:36:19Z) - Improved Bayes Risk Can Yield Reduced Social Welfare Under Competition [99.7047087527422]
本研究は,機械学習のスケーリングトレンドの振る舞いを根本的に変化させることを実証する。
データ表現品質の改善により、ユーザ間での全体的な予測精度が低下する、多くの設定が見つかる。
概念レベルでは,各モデルプロジェクタのスケーリング傾向が,社会福祉の下流改善に寄与する必要はないことが示唆された。
論文 参考訳(メタデータ) (2023-06-26T13:06:34Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - In the Eye of the Beholder: Robust Prediction with Causal User Modeling [27.294341513692164]
データ分布の変化に頑健な関係予測のための学習フレームワークを提案する。
私たちのキーとなる観察は、ユーザがどのように環境を慎重に知覚するかを考慮し、堅牢性を得ることができることです。
論文 参考訳(メタデータ) (2022-06-01T11:33:57Z) - Model-based micro-data reinforcement learning: what are the crucial
model properties and which model to choose? [0.2836066255205732]
我々は,マイクロデータモデルに基づく強化学習(MBRL)に寄与する。
マルチモーダルな後続予測を必要とする環境では、混合密度ネットは他のモデルよりも大きなマージンで優れていることがわかった。
また、決定論的モデルは同等であり、実際、確率論的モデルよりも一貫して(非目立ったことではないが)優れていることも見出した。
論文 参考訳(メタデータ) (2021-07-24T11:38:25Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - My tweets bring all the traits to the yard: Predicting personality and
relational traits in Online Social Networks [4.095574580512599]
本研究は,オンラインソーシャルネットワーク(OSN)における全体像プロファイルの予測モデルを提供することを目的とする。
我々はまずOSNアカウントから幅広い機能を抽出する機能エンジニアリング手法を考案した。
そして,抽出した特徴に基づいて,ユーザの心理的特徴のスコアを予測する機械学習モデルを設計した。
論文 参考訳(メタデータ) (2020-09-22T20:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。