論文の概要: PANDORA Talks: Personality and Demographics on Reddit
- arxiv url: http://arxiv.org/abs/2004.04460v3
- Date: Tue, 8 Jun 2021 13:22:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 03:11:11.744951
- Title: PANDORA Talks: Personality and Demographics on Reddit
- Title(参考訳): PANDORA Talks: Redditのパーソナリティとデモグラフィック
- Authors: Matej Gjurkovi\'c, Mladen Karan, Iva Vukojevi\'c, Mihaela Bo\v{s}njak,
Jan \v{S}najder
- Abstract要約: Redditコメントの最初の大規模データセットであるPANDORAを10万以上のユーザー向けに3つのパーソナリティモデルと人口統計モデルでラベル付けした。
3つの実験でこのデータセットの有用性を示し、より容易に利用できるデータを活用してBig 5の特徴を予測する。
人格および人口統計変数のベンチマーク予測モデルを提案する。
- 参考スコア(独自算出の注目度): 2.4149105714758545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Personality and demographics are important variables in social sciences,
while in NLP they can aid in interpretability and removal of societal biases.
However, datasets with both personality and demographic labels are scarce. To
address this, we present PANDORA, the first large-scale dataset of Reddit
comments labeled with three personality models (including the well-established
Big 5 model) and demographics (age, gender, and location) for more than 10k
users. We showcase the usefulness of this dataset on three experiments, where
we leverage the more readily available data from other personality models to
predict the Big 5 traits, analyze gender classification biases arising from
psycho-demographic variables, and carry out a confirmatory and exploratory
analysis based on psychological theories. Finally, we present benchmark
prediction models for all personality and demographic variables.
- Abstract(参考訳): パーソナリティと人口統計学は社会科学において重要な変数であり、NLPでは社会的偏見の解釈や排除に役立つ。
しかし、パーソナリティと人口動態のラベルを持つデータセットは少ない。
これを解決するために,Redditコメントの最初の大規模データセットであるPANDORAを紹介した。3つのパーソナリティモデル(確立されたBig 5モデルを含む)と人口動態(年齢,性別,位置)を10万以上のユーザに対してラベル付けした。
このデータセットは3つの実験で有用性を示し、他のパーソナリティモデルから得られるより容易に利用できるデータを利用して、大きな5つの特徴を予測し、精神デミック変数から生じる性別分類バイアスを分析し、心理学理論に基づく確認・探索分析を行う。
最後に,すべてのパーソナリティおよび人口統計変数のベンチマーク予測モデルを提案する。
関連論文リスト
- Aligning with Whom? Large Language Models Have Gender and Racial Biases
in Subjective NLP Tasks [15.015148115215315]
我々は4つのポピュラーな大言語モデル(LLM)の実験を行い、集団差と潜在的なバイアスを理解する能力について、丁寧さと不快さの予測について検討する。
どちらのタスクでも、モデル予測は白人と女性の参加者のラベルに近いことが分かりました。
より具体的には、"ブラック"と"アジア"個人の観点から反応するよう促された場合、モデルは、対応するグループからのスコアだけでなく、全体的なスコアを予測する際のパフォーマンスを低下させる。
論文 参考訳(メタデータ) (2023-11-16T10:02:24Z) - Editing Personality for LLMs [95.04195851095481]
本稿では,Large Language Models (LLMs) の性格特性の編集に焦点をあてた革新的なタスクを紹介する。
この課題に対処するため、新しいベンチマークデータセットPersonalityEditを構築した。
論文 参考訳(メタデータ) (2023-10-03T16:02:36Z) - Personality Profiling: How informative are social media profiles in
predicting personal information? [0.046040036610482664]
パーソナリティ・プロファイリングは、ターゲット広告、政治キャンペーン、ワクチンキャンペーンのために企業によって利用されてきた。
我々は,マイアーズ・ブリッグス(Myers-Briggs,マイアーズ・ブリッグス)のパーソナリティをプロファイリングするために,人々のオンラインデジタルフットプリントがどの程度活用できるかを検討することを目的とする。
論文 参考訳(メタデータ) (2023-09-15T03:09:43Z) - Large Language Models Can Infer Psychological Dispositions of Social
Media Users [1.2277343096128712]
本研究では,デジタルフットプリントから個人の心理的沈着を推定する大規模言語モデルの可能性について検討した。
ゼロショット学習シナリオにおいて,GPT-3.5とGPT-4がユーザのFacebookステータス更新からビッグファイブの特徴を引き出す能力を評価する。
以上の結果から,性別や年齢に対する性格推定の偏りが示唆された。
論文 参考訳(メタデータ) (2023-09-13T01:27:48Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Learning signatures of decision making from many individuals playing the
same game [54.33783158658077]
我々は、個人の「行動スタイル」を符号化する表現を学習する予測フレームワークを設計する。
我々は,3本腕のバンディットタスクを行う1,000人の人間による大規模行動データセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-02-21T21:41:53Z) - Gender Stereotyping Impact in Facial Expression Recognition [1.5340540198612824]
近年,機械学習に基づくモデルが表情認識(FER)における最も一般的なアプローチとなっている。
公開可能なFERデータセットでは、見かけ上の性別表現は概ねバランスが取れているが、個々のラベルでの性別表現はそうではない。
我々は、特定のラベルの性別比を変化させることで、異なる量のステレオタイプバイアスを持つ微分データセットを生成する。
我々は、最低バイアス条件下で、性別間の特定の感情の認識において、最大で29 % の差を観察する。
論文 参考訳(メタデータ) (2022-10-11T10:52:23Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - My tweets bring all the traits to the yard: Predicting personality and
relational traits in Online Social Networks [4.095574580512599]
本研究は,オンラインソーシャルネットワーク(OSN)における全体像プロファイルの予測モデルを提供することを目的とする。
我々はまずOSNアカウントから幅広い機能を抽出する機能エンジニアリング手法を考案した。
そして,抽出した特徴に基づいて,ユーザの心理的特徴のスコアを予測する機械学習モデルを設計した。
論文 参考訳(メタデータ) (2020-09-22T20:30:56Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。
1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文 参考訳(メタデータ) (2020-04-16T23:54:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。