論文の概要: Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population Traits
- arxiv url: http://arxiv.org/abs/2412.12510v1
- Date: Tue, 17 Dec 2024 03:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:02:13.230486
- Title: Can Large Language Models Understand You Better? An MBTI Personality Detection Dataset Aligned with Population Traits
- Title(参考訳): 大規模言語モデルの方が理解しやすいか? 人口特性を考慮したMBTIパーソナリティ検出データセット
- Authors: Bohan Li, Jiannan Guan, Longxu Dou, Yunlong Feng, Dingzirui Wang, Yang Xu, Enbo Wang, Qiguang Chen, Bichen Wang, Xiao Xu, Yimeng Zhang, Libo Qin, Yanyan Zhao, Qingfu Zhu, Wanxiang Che,
- Abstract要約: MBTIBenchは,ソフトラベルを用いた手動による高品質なMBTI人格検出データセットである。
最初の課題として、MBTIBenchは、データの29.58%を占める不正なラベル付け問題を効果的に解決している。
得られたソフトレーベルは、非極度の性格特性を持つ人がもっといることを確認した。
- 参考スコア(独自算出の注目度): 57.183688699002836
- License:
- Abstract: The Myers-Briggs Type Indicator (MBTI) is one of the most influential personality theories reflecting individual differences in thinking, feeling, and behaving. MBTI personality detection has garnered considerable research interest and has evolved significantly over the years. However, this task tends to be overly optimistic, as it currently does not align well with the natural distribution of population personality traits. Specifically, (1) the self-reported labels in existing datasets result in incorrect labeling issues, and (2) the hard labels fail to capture the full range of population personality distributions. In this paper, we optimize the task by constructing MBTIBench, the first manually annotated high-quality MBTI personality detection dataset with soft labels, under the guidance of psychologists. As for the first challenge, MBTIBench effectively solves the incorrect labeling issues, which account for 29.58% of the data. As for the second challenge, we estimate soft labels by deriving the polarity tendency of samples. The obtained soft labels confirm that there are more people with non-extreme personality traits. Experimental results not only highlight the polarized predictions and biases in LLMs as key directions for future research, but also confirm that soft labels can provide more benefits to other psychological tasks than hard labels. The code and data are available at https://github.com/Personality-NLP/MbtiBench.
- Abstract(参考訳): Myers-Briggs Type Indicator (MBTI) は、思考、感覚、行動の個人差を反映した最も影響力のある性格理論の一つである。
MBTIの人格検出は研究の関心を集め、長年にわたって大きく進歩してきた。
しかし、この課題は人口性格特性の自然分布と一致しないため、過度に楽観的である傾向にある。
具体的には,(1)既存のデータセットの自己申告ラベルは誤ラベル化の問題を引き起こし,(2)ハードラベルは人口分布の全範囲を把握できない。
本稿では,心理学者の指導のもと,ソフトラベルを用いた最初の手動による高品質なMBTI人格検出データセットであるMBTIBenchを構築し,そのタスクを最適化する。
最初の課題として、MBTIBenchは、データの29.58%を占める不正なラベル付け問題を効果的に解決している。
第2の課題は,サンプルの極性傾向を導出したソフトラベルを推定することである。
得られたソフトレーベルは、非極度の性格特性を持つ人がもっといることを確認した。
実験結果は、LCMの偏極予測とバイアスが将来の研究の鍵となる方向であるだけでなく、ソフトラベルがハードラベルよりも他の心理的タスクにより多くの利益をもたらすことを確認した。
コードとデータはhttps://github.com/Personality-NLP/MbtiBench.comで公開されている。
関連論文リスト
- A Chinese Multi-label Affective Computing Dataset Based on Social Media Network Users [2.0209172586699173]
この研究は、大手ソーシャルメディアプラットフォームWeiboのデータを収集し、MBTIパーソナリティラベルの多様性を持つ5万以上の個人から11,338人の有効なユーザーをスクリーニングした。
我々は、同じユーザの性格特性を6つの感情とマイクロ感情と統合した、複数のラベルの中国感情コンピューティングデータセットをコンパイルし、それぞれに強度レベルを付与した。
このデータセットは、複雑な人間の感情のマシン認識を促進し、心理学、教育、マーケティング、金融、政治の研究のためのデータサポートを提供するように設計されている。
論文 参考訳(メタデータ) (2024-11-13T05:38:55Z) - Neuron-based Personality Trait Induction in Large Language Models [115.08894603023712]
大規模言語モデル (LLM) は、様々な性格特性をシミュレートする能力が増している。
LLMにおけるパーソナリティ特性誘導のためのニューロンに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-16T07:47:45Z) - Revealing Personality Traits: A New Benchmark Dataset for Explainable Personality Recognition on Dialogues [63.936654900356004]
パーソナリティ認識は,対話やソーシャルメディア投稿などのユーザデータに含まれる性格特性を識別することを目的としている。
本稿では,人格特性の証拠として推論過程を明らかにすることを目的とした,説明可能な人格認識という新しい課題を提案する。
論文 参考訳(メタデータ) (2024-09-29T14:41:43Z) - EERPD: Leveraging Emotion and Emotion Regulation for Improving Personality Detection [19.98674724777821]
EERPDと呼ばれる新しい人格検出手法を提案する。
本手法では,人格予測において,人格に強く相関する心理的概念である感情制御を導入する。
実験の結果,ERPDは人格検出の精度とロバスト性を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-06-23T11:18:55Z) - LLMvsSmall Model? Large Language Model Based Text Augmentation Enhanced
Personality Detection Model [58.887561071010985]
パーソナリティ検出は、ソーシャルメディア投稿に根ざした性格特性を検出することを目的としている。
既存のほとんどのメソッドは、事前訓練された言語モデルを微調整することで、ポスト機能を直接学習する。
本稿では,大規模言語モデル (LLM) に基づくテキスト拡張強化人格検出モデルを提案する。
論文 参考訳(メタデータ) (2024-03-12T12:10:18Z) - PsyCoT: Psychological Questionnaire as Powerful Chain-of-Thought for
Personality Detection [50.66968526809069]
PsyCoTと呼ばれる新しい人格検出手法を提案する。これは、個人がマルチターン対話方式で心理的質問を完遂する方法を模倣するものである。
実験の結果,PsyCoTは人格検出におけるGPT-3.5の性能とロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-10-31T08:23:33Z) - Do LLMs Possess a Personality? Making the MBTI Test an Amazing
Evaluation for Large Language Models [2.918940961856197]
我々は,大規模言語モデル(LLM)の評価指標として,人格評価ツールであるMBTI(Myers-Briggs Type Indicator)の有効性を検討することを目的とする。
具体的には,1)異なるLDMの性格タイプ,2)素早いエンジニアリングによる人格タイプの変化の可能性,3)モデルの性格にどのような影響があるかを検討する。
論文 参考訳(メタデータ) (2023-07-30T09:34:35Z) - Exploring Personality and Online Social Engagement: An Investigation of
MBTI Users on Twitter [0.0]
自称マイアーズ・ブリッグス性格特性(MBTI)を用いたTwitterのプロフィール3848件について検討する。
我々は、ディープラーニングに基づく最先端のNLPアーキテクチャであるBERTを利用して、タスクに最も予測力を持つさまざまなテキストソースを分析します。
MBTIシステムの全次元に対して, 伝記, ステータス, お気に入りツイートが有意な予測力を持っていることがわかった。
論文 参考訳(メタデータ) (2021-09-14T02:26:30Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Matching Theory and Data with Personal-ITY: What a Corpus of Italian
YouTube Comments Reveals About Personality [11.38723572165938]
私たちはイタリア語でYouTubeコメントの新しいコーパスを作成し、そこでは作家が個性的な特徴をラベル付けしている。
この特徴はMBTIという心理学研究における主要な個性理論の1つに由来する。
本研究は, TwiStyだけでなく, コーパス上での個性予測の課題について検討する。
論文 参考訳(メタデータ) (2020-11-11T12:45:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。