論文の概要: Items from Psychometric Tests as Training Data for Personality Profiling
Models of Twitter Users
- arxiv url: http://arxiv.org/abs/2202.10415v1
- Date: Mon, 21 Feb 2022 18:24:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 09:24:57.450994
- Title: Items from Psychometric Tests as Training Data for Personality Profiling
Models of Twitter Users
- Title(参考訳): twitterユーザーのパーソナリティ・プロファイリングモデルのためのトレーニングデータとしての心理計測テスト項目
- Authors: Anne Kreuter and Kai Sassenberg and Roman Klinger
- Abstract要約: ソーシャルメディアにおける著者プロファイリングのための機械学習モデルは、しばしば、ソーシャルメディアユーザーによって満たされた自己報告ベースの心理測定テスト(クエクションネア)を通じて取得されたデータに依存している。
もう1つのコストの安い代替手段は、ユーザーのプロフィールにある公開情報から推測されるラベルに依存することである。
本稿では,検証された心理測定テストの項目のコーパスを直接トレーニングデータとして利用する第3の戦略について検討する。
- 参考スコア(独自算出の注目度): 10.794240050116363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine-learned models for author profiling in social media often rely on
data acquired via self-reporting-based psychometric tests (questionnaires)
filled out by social media users. This is an expensive but accurate data
collection strategy. Another, less costly alternative, which leads to
potentially more noisy and biased data, is to rely on labels inferred from
publicly available information in the profiles of the users, for instance
self-reported diagnoses or test results. In this paper, we explore a third
strategy, namely to directly use a corpus of items from validated psychometric
tests as training data. Items from psychometric tests often consist of
sentences from an I-perspective (e.g., "I make friends easily."). Such corpora
of test items constitute 'small data', but their availability for many concepts
is a rich resource. We investigate this approach for personality profiling, and
evaluate BERT classifiers fine-tuned on such psychometric test items for the
big five personality traits (openness, conscientiousness, extraversion,
agreeableness, neuroticism) and analyze various augmentation strategies
regarding their potential to address the challenges coming with such a small
corpus. Our evaluation on a publicly available Twitter corpus shows a
comparable performance to in-domain training for 4/5 personality traits with
T5-based data augmentation.
- Abstract(参考訳): ソーシャルメディアにおける著者のプロファイリングのための機械学習モデルは、ソーシャルメディア利用者が記入した自己報告に基づく心理測定テスト(questionnaires)によって取得されたデータに依存することが多い。
これは高価なが正確なデータ収集戦略である。
もうひとつのコストの低い代替手段は、潜在的にノイズやバイアスのあるデータにつながるもので、例えば自己報告された診断やテスト結果など、ユーザのプロファイルで公開されている情報から推測されるラベルに依存することだ。
本稿では,検証された心理測定テストの項目をトレーニングデータとして直接利用する第3の戦略について検討する。
心理測定テストの項目は、しばしばi-perspective(i-perspective)の文からなる(例えば、"i make friends easy")。
このようなテスト項目のコーパスは「小さなデータ」を構成するが、多くの概念で利用できるのは豊富なリソースである。
パーソナリティ・プロファイリングのためのこのアプローチを調査し,このような心理計測テスト項目を微調整したbert分類器(開放性,良心性,外向性,一致性,神経症)を評価し,これらの小さなコーパスで生じる課題に対処するための様々な強化戦略を分析した。
公開されているTwitterコーパスに対する評価では、T5ベースのデータ拡張による4/5人格特性のドメイン内トレーニングに匹敵するパフォーマンスを示した。
関連論文リスト
- PsyCoT: Psychological Questionnaire as Powerful Chain-of-Thought for
Personality Detection [50.66968526809069]
PsyCoTと呼ばれる新しい人格検出手法を提案する。これは、個人がマルチターン対話方式で心理的質問を完遂する方法を模倣するものである。
実験の結果,PsyCoTは人格検出におけるGPT-3.5の性能とロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-10-31T08:23:33Z) - Personality Profiling: How informative are social media profiles in
predicting personal information? [0.046040036610482664]
パーソナリティ・プロファイリングは、ターゲット広告、政治キャンペーン、ワクチンキャンペーンのために企業によって利用されてきた。
我々は,マイアーズ・ブリッグス(Myers-Briggs,マイアーズ・ブリッグス)のパーソナリティをプロファイリングするために,人々のオンラインデジタルフットプリントがどの程度活用できるかを検討することを目的とする。
論文 参考訳(メタデータ) (2023-09-15T03:09:43Z) - Personality Detection and Analysis using Twitter Data [7.584657555037871]
私たちは、研究コミュニティのために、最も大きな自動キュレートされたデータセットをリリースします。
このデータセットには1億5200万のツイートと、Myers-Briggs Personal Type (MBTI)予測タスク用の56万のデータポイントが含まれている。
興味深い分析結果が自然の直感にどのように従うかを示す。
論文 参考訳(メタデータ) (2023-09-11T14:39:04Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - Constructing a Testbed for Psychometric Natural Language Processing [0.5801044612920815]
心理測定自然言語処理(NLP)のためのコーパス構築への取り組みについて述べる。
我々は,ユーザテキストを調査に基づく回答項目と整合させる多段階プロセスについて論じる。
本稿では,ユーザの調査回答ラベルを分類・予測するためのテキストの使用に関する予備的な結果について報告する。
論文 参考訳(メタデータ) (2020-07-25T16:29:24Z) - Jointly Predicting Job Performance, Personality, Cognitive Ability,
Affect, and Well-Being [42.67003631848889]
本研究では,身体的および生理的行動,心理的状態と特徴,職能を統合した個人予測分析のためのベンチマークを作成する。
我々は、データマイニング技術をベンチマークとして設計し、ウェアラブルセンサから得られた真のノイズと不完全なデータを用いて、12の標準化された精確なテストに基づいて19の構造を予測する。
論文 参考訳(メタデータ) (2020-06-10T14:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。