論文の概要: Who Are You Behind the Screen? Implicit MBTI and Gender Detection Using Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2503.09853v2
- Date: Fri, 14 Mar 2025 23:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:36:50.560558
- Title: Who Are You Behind the Screen? Implicit MBTI and Gender Detection Using Artificial Intelligence
- Title(参考訳): 画面の裏側にいるのは誰か?人工知能によるMBTIとジェンダー検出
- Authors: Kourosh Shahnazari, Seyed Moein Ayyoubzadeh,
- Abstract要約: 本研究は,Telegram 会話データにおける言語パターンから直接,人格と性別の変数を推定する暗黙の分類について検討する。
本研究では,トランスフォーマーに基づく言語モデル (RoBERTa) を改良し,人格特性や性差を示す複雑な言語的手がかりを抽出する。
信頼度はモデル精度を86.16%に大きく上げるのに役立つため、RoBERTaは会話テキストデータから暗黙のパーソナリティタイプを一貫して識別する能力を持っている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In personalized technology and psychological research, precisely detecting demographic features and personality traits from digital interactions becomes ever more important. This work investigates implicit categorization, inferring personality and gender variables directly from linguistic patterns in Telegram conversation data, while conventional personality prediction techniques mostly depend on explicitly self-reported labels. We refine a Transformer-based language model (RoBERTa) to capture complex linguistic cues indicative of personality traits and gender differences using a dataset comprising 138,866 messages from 1,602 users annotated with MBTI types and 195,016 messages from 2,598 users annotated with gender. Confidence levels help to greatly raise model accuracy to 86.16\%, hence proving RoBERTa's capacity to consistently identify implicit personality types from conversational text data. Our results highlight the usefulness of Transformer topologies for implicit personality and gender classification, hence stressing their efficiency and stressing important trade-offs between accuracy and coverage in realistic conversational environments. With regard to gender classification, the model obtained an accuracy of 74.4\%, therefore capturing gender-specific language patterns. Personality dimension analysis showed that people with introverted and intuitive preferences are especially more active in text-based interactions. This study emphasizes practical issues in balancing accuracy and data coverage as Transformer-based models show their efficiency in implicit personality and gender prediction tasks from conversational texts.
- Abstract(参考訳): パーソナライズされた技術と心理学研究では、デジタルインタラクションから人口動態の特徴や性格の特徴を正確に検出することがますます重要になる。
本研究では,Telegramの会話データから人格と性別の変数を直接推定する暗黙の分類について検討する。
我々はトランスフォーマーに基づく言語モデル(RoBERTa)を改良し、MBTIタイプに注釈付き1,602ユーザ138,866メッセージ、性別に注釈付き2,598ユーザ195,016メッセージからなるデータセットを用いて、人格特性と性差を示す複雑な言語的手がかりを抽出する。
信頼度はモデル精度を86.16\%に大きく上げるのに役立つため、RoBERTaは会話テキストデータから暗黙のパーソナリティタイプを一貫して識別する能力を持っている。
本研究は,トランスフォーマートポロジを用いた暗黙的性格分類と性別分類の有用性を強調し,その効率性を強調し,現実的な会話環境における正確さと包括性の間の重要なトレードオフを強調した。
性別分類に関して、このモデルは74.4\%の精度を得たため、性別固有の言語パターンをキャプチャした。
パーソナリティ次元分析の結果,内向的・直感的な嗜好を持つ人は,特にテキストベースのインタラクションにおいて活発であることが示唆された。
本研究では,トランスフォーマーをベースとしたモデルが,会話テキストから暗黙的個性や性別予測タスクの効率を示すため,精度とデータカバレッジのバランスをとる上での実践的課題を強調した。
関連論文リスト
- Blind Men and the Elephant: Diverse Perspectives on Gender Stereotypes in Benchmark Datasets [17.101242741559428]
本稿では,言語モデルの固有バイアス緩和と測定戦略に焦点を当てる。
我々は、本質的な測定を深く掘り下げ、矛盾を識別し、これらのベンチマークがジェンダーステレオタイプの違いを反映している可能性を示唆している。
本研究は, 言語モデルにおけるジェンダーステレオタイピングの複雑さと, 偏見の検出・低減のための, より洗練された手法を開発するための新たな方向性を指摘するものである。
論文 参考訳(メタデータ) (2025-01-02T09:40:31Z) - Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - Large Language Models Can Infer Personality from Free-Form User Interactions [0.0]
GPT-4は、パーソナリティを適度な精度で推測することができ、以前のアプローチよりも優れていた。
その結果,人格評価への直接的注力は,ユーザエクスペリエンスの低下を招いていないことがわかった。
予備的な分析は、人格推定の正確さは、社会デミノグラフィーのサブグループによってわずかに異なることを示唆している。
論文 参考訳(メタデータ) (2024-05-19T20:33:36Z) - LLMvsSmall Model? Large Language Model Based Text Augmentation Enhanced
Personality Detection Model [58.887561071010985]
パーソナリティ検出は、ソーシャルメディア投稿に根ざした性格特性を検出することを目的としている。
既存のほとんどのメソッドは、事前訓練された言語モデルを微調整することで、ポスト機能を直接学習する。
本稿では,大規模言語モデル (LLM) に基づくテキスト拡張強化人格検出モデルを提案する。
論文 参考訳(メタデータ) (2024-03-12T12:10:18Z) - Can ChatGPT Read Who You Are? [10.577227353680994]
チェコ語で書かれたテキストを代表とする総合的なユーザスタディの結果を155人のサンプルで報告した。
本研究は,ChatGPTによる性格特性推定と人間による評価とを比較し,テキストから人格特性を推定する際のChatGPTの競争性能を報告する。
論文 参考訳(メタデータ) (2023-12-26T14:43:04Z) - Personality Style Recognition via Machine Learning: Identifying
Anaclitic and Introjective Personality Styles from Patients' Speech [6.3042597209752715]
自然言語処理(NLP)と機械学習ツールを使って分類する。
大うつ病(MDD)と診断された79人の患者を対象に、記録された臨床診断面接(CDI)のデータセットでこれを検証した。
言語由来の特徴(LIWCに基づく)による自動分類は,アンケートに基づく分類モデルよりも有意に優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-07T15:56:19Z) - PsyCoT: Psychological Questionnaire as Powerful Chain-of-Thought for
Personality Detection [50.66968526809069]
PsyCoTと呼ばれる新しい人格検出手法を提案する。これは、個人がマルチターン対話方式で心理的質問を完遂する方法を模倣するものである。
実験の結果,PsyCoTは人格検出におけるGPT-3.5の性能とロバスト性を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2023-10-31T08:23:33Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。