論文の概要: Personality Profiling: How informative are social media profiles in
predicting personal information?
- arxiv url: http://arxiv.org/abs/2309.13065v1
- Date: Fri, 15 Sep 2023 03:09:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-01 12:12:03.552868
- Title: Personality Profiling: How informative are social media profiles in
predicting personal information?
- Title(参考訳): パーソナリティ・プロファイリング:ソーシャルメディア・プロフィールは個人情報の予測にどの程度有益か?
- Authors: Joshua Watt, Jonathan Tuke and Lewis Mitchell
- Abstract要約: パーソナリティ・プロファイリングは、ターゲット広告、政治キャンペーン、ワクチンキャンペーンのために企業によって利用されてきた。
我々は,マイアーズ・ブリッグス(Myers-Briggs,マイアーズ・ブリッグス)のパーソナリティをプロファイリングするために,人々のオンラインデジタルフットプリントがどの程度活用できるかを検討することを目的とする。
- 参考スコア(独自算出の注目度): 0.046040036610482664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personality profiling has been utilised by companies for targeted
advertising, political campaigns and vaccine campaigns. However, the accuracy
and versatility of such models still remains relatively unknown. Consequently,
we aim to explore the extent to which peoples' online digital footprints can be
used to profile their Myers-Briggs personality type. We analyse and compare the
results of four models: logistic regression, naive Bayes, support vector
machines (SVMs) and random forests. We discover that a SVM model achieves the
best accuracy of 20.95% for predicting someones complete personality type.
However, logistic regression models perform only marginally worse and are
significantly faster to train and perform predictions. We discover that many
labelled datasets present substantial class imbalances of personal
characteristics on social media, including our own. As a result, we highlight
the need for attentive consideration when reporting model performance on these
datasets and compare a number of methods for fixing the class-imbalance
problems. Moreover, we develop a statistical framework for assessing the
importance of different sets of features in our models. We discover some
features to be more informative than others in the Intuitive/Sensory (p =
0.032) and Thinking/Feeling (p = 0.019) models. While we apply these methods to
Myers-Briggs personality profiling, they could be more generally used for any
labelling of individuals on social media.
- Abstract(参考訳): パーソナリティ・プロファイリングは、ターゲット広告、政治キャンペーン、ワクチンキャンペーンなどに利用されてきた。
しかし、そのようなモデルの精度と汎用性はいまだによく分かっていない。
そこで本稿では,マイアーズ・ブリッグス・パーソナリティ・タイプをプロファイリングするために,人々のオンラインデジタルフットプリントがどの程度活用できるかを検討する。
我々は,ロジスティック回帰,ナイーブベイズ,サポートベクターマシン(svm),ランダムフォレストという4つのモデルの結果を分析し比較した。
我々は,SVMモデルが完全な性格型を予測する上で,20.95%の精度を達成することを発見した。
しかし、ロジスティック回帰モデルはわずかに悪化し、予測の訓練と実行が大幅に高速化される。
多くのラベル付きデータセットが、私たち自身を含むソーシャルメディア上の個人的特徴の実質的な階級的不均衡を示すことがわかった。
その結果,これらのデータセット上でモデル性能を報告する際の注意深い考察の必要性を強調し,クラス不均衡問題を解決するための方法をいくつか比較した。
さらに,モデルにおける異なる特徴集合の重要性を評価するための統計的枠組みを開発した。
Intuitive/Sensory (p = 0.032) モデルや Thinking/Feeling (p = 0.019) モデルでは、いくつかの特徴が他の機能よりも有益である。
これらの手法をマイアーズ・ブリッグス・パーソナリティ・プロファイリングに適用するが,ソーシャルメディア上での個人ラベル付けにはより一般的である。
関連論文リスト
- Debiasing Multimodal Models via Causal Information Minimization [65.23982806840182]
我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文 参考訳(メタデータ) (2023-11-28T16:46:14Z) - Large Language Models Can Infer Psychological Dispositions of Social
Media Users [1.2277343096128712]
本研究では,デジタルフットプリントから個人の心理的沈着を推定する大規模言語モデルの可能性について検討した。
ゼロショット学習シナリオにおいて,GPT-3.5とGPT-4がユーザのFacebookステータス更新からビッグファイブの特徴を引き出す能力を評価する。
以上の結果から,性別や年齢に対する性格推定の偏りが示唆された。
論文 参考訳(メタデータ) (2023-09-13T01:27:48Z) - Personality Detection and Analysis using Twitter Data [7.584657555037871]
私たちは、研究コミュニティのために、最も大きな自動キュレートされたデータセットをリリースします。
このデータセットには1億5200万のツイートと、Myers-Briggs Personal Type (MBTI)予測タスク用の56万のデータポイントが含まれている。
興味深い分析結果が自然の直感にどのように従うかを示す。
論文 参考訳(メタデータ) (2023-09-11T14:39:04Z) - On the Connection between Pre-training Data Diversity and Fine-tuning
Robustness [66.30369048726145]
下流の有効ロバスト性に影響を与える主な要因はデータ量である。
各種自然および合成データソースから抽出した事前学習分布について,本研究の成果を示す。
論文 参考訳(メタデータ) (2023-07-24T05:36:19Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Metrics for Dataset Demographic Bias: A Case Study on Facial Expression
Recognition [1.5340540198612824]
人口統計バイアスの最も顕著な種類は、データセットにおける人口統計群の表現における統計的不均衡である。
我々はこれらの指標を分類するための分類法を開発し、適切な指標を選択するための実践的なガイドを提供する。
この論文は、データセットバイアスを緩和し、AIモデルの公正性と正確性を改善するために、AIと関連する分野の研究者に貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-28T11:04:18Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - My tweets bring all the traits to the yard: Predicting personality and
relational traits in Online Social Networks [4.095574580512599]
本研究は,オンラインソーシャルネットワーク(OSN)における全体像プロファイルの予測モデルを提供することを目的とする。
我々はまずOSNアカウントから幅広い機能を抽出する機能エンジニアリング手法を考案した。
そして,抽出した特徴に基づいて,ユーザの心理的特徴のスコアを予測する機械学習モデルを設計した。
論文 参考訳(メタデータ) (2020-09-22T20:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。