論文の概要: Items from Psychometric Tests as Training Data for Personality Profiling
Models of Twitter Users
- arxiv url: http://arxiv.org/abs/2202.10415v1
- Date: Mon, 21 Feb 2022 18:24:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 09:24:57.450994
- Title: Items from Psychometric Tests as Training Data for Personality Profiling
Models of Twitter Users
- Title(参考訳): twitterユーザーのパーソナリティ・プロファイリングモデルのためのトレーニングデータとしての心理計測テスト項目
- Authors: Anne Kreuter and Kai Sassenberg and Roman Klinger
- Abstract要約: ソーシャルメディアにおける著者プロファイリングのための機械学習モデルは、しばしば、ソーシャルメディアユーザーによって満たされた自己報告ベースの心理測定テスト(クエクションネア)を通じて取得されたデータに依存している。
もう1つのコストの安い代替手段は、ユーザーのプロフィールにある公開情報から推測されるラベルに依存することである。
本稿では,検証された心理測定テストの項目のコーパスを直接トレーニングデータとして利用する第3の戦略について検討する。
- 参考スコア(独自算出の注目度): 10.794240050116363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine-learned models for author profiling in social media often rely on
data acquired via self-reporting-based psychometric tests (questionnaires)
filled out by social media users. This is an expensive but accurate data
collection strategy. Another, less costly alternative, which leads to
potentially more noisy and biased data, is to rely on labels inferred from
publicly available information in the profiles of the users, for instance
self-reported diagnoses or test results. In this paper, we explore a third
strategy, namely to directly use a corpus of items from validated psychometric
tests as training data. Items from psychometric tests often consist of
sentences from an I-perspective (e.g., "I make friends easily."). Such corpora
of test items constitute 'small data', but their availability for many concepts
is a rich resource. We investigate this approach for personality profiling, and
evaluate BERT classifiers fine-tuned on such psychometric test items for the
big five personality traits (openness, conscientiousness, extraversion,
agreeableness, neuroticism) and analyze various augmentation strategies
regarding their potential to address the challenges coming with such a small
corpus. Our evaluation on a publicly available Twitter corpus shows a
comparable performance to in-domain training for 4/5 personality traits with
T5-based data augmentation.
- Abstract(参考訳): ソーシャルメディアにおける著者のプロファイリングのための機械学習モデルは、ソーシャルメディア利用者が記入した自己報告に基づく心理測定テスト(questionnaires)によって取得されたデータに依存することが多い。
これは高価なが正確なデータ収集戦略である。
もうひとつのコストの低い代替手段は、潜在的にノイズやバイアスのあるデータにつながるもので、例えば自己報告された診断やテスト結果など、ユーザのプロファイルで公開されている情報から推測されるラベルに依存することだ。
本稿では,検証された心理測定テストの項目をトレーニングデータとして直接利用する第3の戦略について検討する。
心理測定テストの項目は、しばしばi-perspective(i-perspective)の文からなる(例えば、"i make friends easy")。
このようなテスト項目のコーパスは「小さなデータ」を構成するが、多くの概念で利用できるのは豊富なリソースである。
パーソナリティ・プロファイリングのためのこのアプローチを調査し,このような心理計測テスト項目を微調整したbert分類器(開放性,良心性,外向性,一致性,神経症)を評価し,これらの小さなコーパスで生じる課題に対処するための様々な強化戦略を分析した。
公開されているTwitterコーパスに対する評価では、T5ベースのデータ拡張による4/5人格特性のドメイン内トレーニングに匹敵するパフォーマンスを示した。
関連論文リスト
- Are LLMs effective psychological assessors? Leveraging adaptive RAG for interpretable mental health screening through psychometric practice [2.9775344067885974]
本稿では,ソーシャルメディアの投稿を分析し,心理的アンケートを補完する適応型検索・拡張生成(RAG)手法を提案する。
本手法は,心理調査において各質問に対する最も関連性の高いユーザ投稿を検索し,ゼロショット環境でのアンケート結果の予測にLarge Language Models (LLMs) を用いる。
論文 参考訳(メタデータ) (2025-01-02T00:01:54Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - PsyCoT: Psychological Questionnaire as Powerful Chain-of-Thought for
Personality Detection [50.66968526809069]
PsyCoTと呼ばれる新しい人格検出手法を提案する。これは、個人がマルチターン対話方式で心理的質問を完遂する方法を模倣するものである。
実験の結果,PsyCoTは人格検出におけるGPT-3.5の性能とロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-10-31T08:23:33Z) - Large Language Models Can Infer Psychological Dispositions of Social Media Users [1.0923877073891446]
GPT-3.5とGPT-4は、ゼロショット学習シナリオにおいて、ユーザのFacebookステータス更新からビッグファイブの性格特性を導出できるかどうかを検証する。
その結果, LLM-inferred と self-reported trait score の間には r =.29 (range = [.22,.33]) の相関が認められた。
予測は、いくつかの特徴について、女性と若い個人にとってより正確であることが判明し、基礎となるトレーニングデータやオンライン自己表現の違いから生じる潜在的なバイアスが示唆された。
論文 参考訳(メタデータ) (2023-09-13T01:27:48Z) - Personality Detection and Analysis using Twitter Data [7.584657555037871]
私たちは、研究コミュニティのために、最も大きな自動キュレートされたデータセットをリリースします。
このデータセットには1億5200万のツイートと、Myers-Briggs Personal Type (MBTI)予測タスク用の56万のデータポイントが含まれている。
興味深い分析結果が自然の直感にどのように従うかを示す。
論文 参考訳(メタデータ) (2023-09-11T14:39:04Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - Jointly Predicting Job Performance, Personality, Cognitive Ability,
Affect, and Well-Being [42.67003631848889]
本研究では,身体的および生理的行動,心理的状態と特徴,職能を統合した個人予測分析のためのベンチマークを作成する。
我々は、データマイニング技術をベンチマークとして設計し、ウェアラブルセンサから得られた真のノイズと不完全なデータを用いて、12の標準化された精確なテストに基づいて19の構造を予測する。
論文 参考訳(メタデータ) (2020-06-10T14:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。