Fugu-MT 論文翻訳(概要): PANDORA Talks: Personality and Demographics on Reddit

論文の概要: PANDORA Talks: Personality and Demographics on Reddit

arxiv url: http://arxiv.org/abs/2004.04460v3
Date: Tue, 8 Jun 2021 13:22:41 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-15 03:11:11.744951
Title: PANDORA Talks: Personality and Demographics on Reddit
Title（参考訳）: PANDORA Talks: Redditのパーソナリティとデモグラフィック
Authors: Matej Gjurkovi\'c, Mladen Karan, Iva Vukojevi\'c, Mihaela Bo\v{s}njak, Jan \v{S}najder
Abstract要約: Redditコメントの最初の大規模データセットであるPANDORAを10万以上のユーザー向けに3つのパーソナリティモデルと人口統計モデルでラベル付けした。 3つの実験でこのデータセットの有用性を示し、より容易に利用できるデータを活用してBig 5の特徴を予測する。人格および人口統計変数のベンチマーク予測モデルを提案する。
参考スコア（独自算出の注目度）: 2.4149105714758545
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Personality and demographics are important variables in social sciences, while in NLP they can aid in interpretability and removal of societal biases. However, datasets with both personality and demographic labels are scarce. To address this, we present PANDORA, the first large-scale dataset of Reddit comments labeled with three personality models (including the well-established Big 5 model) and demographics (age, gender, and location) for more than 10k users. We showcase the usefulness of this dataset on three experiments, where we leverage the more readily available data from other personality models to predict the Big 5 traits, analyze gender classification biases arising from psycho-demographic variables, and carry out a confirmatory and exploratory analysis based on psychological theories. Finally, we present benchmark prediction models for all personality and demographic variables.
Abstract（参考訳）: パーソナリティと人口統計学は社会科学において重要な変数であり、NLPでは社会的偏見の解釈や排除に役立つ。しかし、パーソナリティと人口動態のラベルを持つデータセットは少ない。これを解決するために,Redditコメントの最初の大規模データセットであるPANDORAを紹介した。3つのパーソナリティモデル(確立されたBig 5モデルを含む)と人口動態(年齢,性別,位置)を10万以上のユーザに対してラベル付けした。このデータセットは3つの実験で有用性を示し、他のパーソナリティモデルから得られるより容易に利用できるデータを利用して、大きな5つの特徴を予測し、精神デミック変数から生じる性別分類バイアスを分析し、心理学理論に基づく確認・探索分析を行う。最後に,すべてのパーソナリティおよび人口統計変数のベンチマーク予測モデルを提案する。

関連論文リスト

Measuring Social Bias in Vision-Language Models with Face-Only Counterfactuals from Real Photos [79.03150233804458]
現実のイメージは人種と性別を混在させ、背景や衣服などの関連要因や属性を隠蔽する。テキストのみの対実的評価パラダイムを提案する。我々は、人種や性別に関連する顔属性のみを編集し、他の視覚的要素を全て固定することで、反事実的変異を生成する。
論文参考訳（メタデータ） (2026-01-11T14:35:06Z)
A Computational Framework for Interpretable Text-Based Personality Assessment from Social Media [0.0]
この論文では、Redditから収集された2つのデータセット(MBTI9kとPANDORA)を提示する。 PANDORAデータセットには、1万人以上のユーザーからの1700万のコメントが含まれている。 SIMPAフレームワークは人格評価を解釈するための計算フレームワークである。
論文参考訳（メタデータ） (2025-10-03T08:36:36Z)
Investigating Gender Bias in LLM-Generated Stories via Psychological Stereotypes [8.091664636677637]
本研究では,大規模言語モデル(LLM)におけるジェンダーバイアスについて,心理学で研究されたジェンダーステレオタイプを用いて検討する。我々は,25の心理的ステレオタイプから1,2,6のランダム属性に無条件または条件付きのいずれかの短いストーリーを含むStereoBias-Storiesという新しいデータセットを紹介した。これらの属性に反応して、全体の物語におけるジェンダーコントリビューションがどのように変化するかを分析し、3つの重要な知見を提示する。
論文参考訳（メタデータ） (2025-08-05T10:10:26Z)
Surface Fairness, Deep Bias: A Comparative Study of Bias in Language Models [49.41113560646115]
大規模言語モデル(LLM)におけるバイアスの様々なプロキシ尺度について検討する。 MMLU (Multi-subject benchmark) を用いた人格評価モデルでは, スコアの無作為かつ大半がランダムな差が生じることがわかった。 LLMアシスタントメモリとパーソナライゼーションの最近の傾向により、これらの問題は異なる角度から開かれている。
論文参考訳（メタデータ） (2025-06-12T08:47:40Z)
Big5PersonalityEssays: Introducing a Novel Synthetic Generated Dataset Consisting of Short State-of-Consciousness Essays Annotated Based on the Five Factor Model of Personality [0.0]
心理学は、近年、新しい計算ツールを使って、不十分なアプローチをしてきた。本研究では,人格特性の5因子モデル(FFM)に基づいてラベル付けされた短いエッセイの合成データベースを提案する。
論文参考訳（メタデータ） (2024-05-22T10:10:20Z)
Aligning with Whom? Large Language Models Have Gender and Racial Biases in Subjective NLP Tasks [15.015148115215315]
我々は4つのポピュラーな大言語モデル(LLM)の実験を行い、集団差と潜在的なバイアスを理解する能力について、丁寧さと不快さの予測について検討する。どちらのタスクでも、モデル予測は白人と女性の参加者のラベルに近いことが分かりました。より具体的には、"ブラック"と"アジア"個人の観点から反応するよう促された場合、モデルは、対応するグループからのスコアだけでなく、全体的なスコアを予測する際のパフォーマンスを低下させる。
論文参考訳（メタデータ） (2023-11-16T10:02:24Z)
Aligning Large Language Models with Human Opinions through Persona Selection and Value--Belief--Norm Reasoning [67.33899440998175]
Chain-of-Opinion (COO)は、単純な4段階のソリューションモデリングであり、ペルソナによる推論方法である。 COOは明示的な人格(デモグラフィーとイデオロギー)と暗黙的な人格(歴史学的な意見)を区別する COOは、推論コールを5回だけ促すことで、新しい最先端の意見予測を効率的に達成し、以前のテクニックを最大4%改善する。
論文参考訳（メタデータ） (2023-11-14T18:48:27Z)
On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-08T19:01:13Z)
Editing Personality for Large Language Models [73.59001811199823]
本稿では,Large Language Models (LLMs) の性格特性の編集に焦点をあてた革新的なタスクを紹介する。このタスクに対処する新しいベンチマークデータセットであるPersonalityEditを構築します。
論文参考訳（メタデータ） (2023-10-03T16:02:36Z)
Personality Profiling: How informative are social media profiles in predicting personal information? [0.04096453902709291]
我々は、人々のオンラインデジタルフットプリントが、彼らのマイアーズ・ブリッグス・パーソナリティのタイプをプロファイリングできる範囲について調べる。我々は,ロジスティック回帰,ナイーブベイズ,サポートベクターマシン(SVM),ランダムフォレストという4つのモデルを比較した。 SVMモデルは、完全なパーソナリティの型を予測するために20.95%の精度を達成する。
論文参考訳（メタデータ） (2023-09-15T03:09:43Z)
Large Language Models Can Infer Psychological Dispositions of Social Media Users [1.0923877073891446]
GPT-3.5とGPT-4は、ゼロショット学習シナリオにおいて、ユーザのFacebookステータス更新からビッグファイブの性格特性を導出できるかどうかを検証する。その結果, LLM-inferred と self-reported trait score の間には r =.29 (range = [.22,.33]) の相関が認められた。予測は、いくつかの特徴について、女性と若い個人にとってより正確であることが判明し、基礎となるトレーニングデータやオンライン自己表現の違いから生じる潜在的なバイアスが示唆された。
論文参考訳（メタデータ） (2023-09-13T01:27:48Z)
Gender Stereotyping Impact in Facial Expression Recognition [1.5340540198612824]
近年,機械学習に基づくモデルが表情認識(FER)における最も一般的なアプローチとなっている。公開可能なFERデータセットでは、見かけ上の性別表現は概ねバランスが取れているが、個々のラベルでの性別表現はそうではない。我々は、特定のラベルの性別比を変化させることで、異なる量のステレオタイプバイアスを持つ微分データセットを生成する。我々は、最低バイアス条件下で、性別間の特定の感情の認識において、最大で29 % の差を観察する。
論文参考訳（メタデータ） (2022-10-11T10:52:23Z)
Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文参考訳（メタデータ） (2021-06-20T10:48:49Z)
My tweets bring all the traits to the yard: Predicting personality and relational traits in Online Social Networks [4.095574580512599]
本研究は,オンラインソーシャルネットワーク(OSN)における全体像プロファイルの予測モデルを提供することを目的とする。我々はまずOSNアカウントから幅広い機能を抽出する機能エンジニアリング手法を考案した。そして,抽出した特徴に基づいて,ユーザの心理的特徴のスコアを予測する機械学習モデルを設計した。
論文参考訳（メタデータ） (2020-09-22T20:30:56Z)
Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文参考訳（メタデータ） (2020-08-31T17:44:28Z)
REVISE: A Tool for Measuring and Mitigating Bias in Visual Datasets [64.76453161039973]
REVISE(Revealing VIsual biaSEs)は、視覚的データセットの調査を支援するツールである。 1)オブジェクトベース,(2)個人ベース,(3)地理ベースという3つの次元に沿った潜在的なバイアスを呈示する。
論文参考訳（メタデータ） (2020-04-16T23:54:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。