論文の概要: Annotating Dimensions of Social Perception in Text: The First Sentence-Level Dataset of Warmth and Competence
- arxiv url: http://arxiv.org/abs/2601.06316v1
- Date: Fri, 09 Jan 2026 21:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.747822
- Title: Annotating Dimensions of Social Perception in Text: The First Sentence-Level Dataset of Warmth and Competence
- Title(参考訳): テキストにおける社会的知覚の次元の注釈:ウォームスとコンピテンスの最初の文レベルデータセット
- Authors: Mutaz Ayesh, Saif M. Mohammad, Nedjma Ousidhoum,
- Abstract要約: 本稿では,ウォームス・コンピテンス・センテンス(W&C-Sent)について紹介する。
データセットには1,600以上の英語の文-ターゲットペアが含まれており、信頼と社会的可能性(温かさの成分)と能力の3つの側面に沿って注釈付けされている。
- 参考スコア(独自算出の注目度): 21.01450102742512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Warmth (W) (often further broken down into Trust (T) and Sociability (S)) and Competence (C) are central dimensions along which people evaluate individuals and social groups (Fiske, 2018). While these constructs are well established in social psychology, they are only starting to get attention in NLP research through word-level lexicons, which do not completely capture their contextual expression in larger text units and discourse. In this work, we introduce Warmth and Competence Sentences (W&C-Sent), the first sentence-level dataset annotated for warmth and competence. The dataset includes over 1,600 English sentence--target pairs annotated along three dimensions: trust and sociability (components of warmth), and competence. The sentences in W&C-Sent are from social media and often express attitudes and opinions about specific individuals or social groups (the targets of our annotations). We describe the data collection, annotation, and quality-control procedures in detail, and evaluate a range of large language models (LLMs) on their ability to identify trust, sociability, and competence in text. W&C-Sent provides a new resource for analyzing warmth and competence in language and supports future research at the intersection of NLP and computational social science.
- Abstract(参考訳): Warmth (W) (さらにTrust (T) と Sociability (S) に分解されることが多い) と Competence (C) は、人々が個人や社会グループを評価する中心的な次元である(Fiske, 2018)。
これらの構造は社会心理学において確立されているが、より大きなテキスト単位や談話において文脈表現を完全に捉えていない単語レベルの語彙を通して、NLP研究においてのみ注目され始めている。
本稿では,ウォームス・アンド・コンピテンス・センテンス(W&C-Sent)について紹介する。
データセットには1,600以上の英語の文-ターゲットペアが含まれており、信頼と社会的可能性(温かさの成分)と能力の3つの側面に沿って注釈付けされている。
W&C-Sentの文はソーシャルメディアからのものであり、特定の個人や社会グループ(私たちのアノテーションの標的)についての態度や意見を表すことが多い。
データ収集,アノテーション,品質管理の手順を詳述し,テキストにおける信頼,社会的可能性,能力の識別能力について,多種多様な言語モデル(LLM)を評価した。
W&C-Sentは、言語における暖かさと能力を分析するための新しいリソースを提供し、NLPと計算社会科学の交差点における将来の研究を支援する。
関連論文リスト
- MindSET: Advancing Mental Health Benchmarking through Large-Scale Social Media Data [29.110680511845327]
Reddit から収集した新たなベンチマークデータセット textbfMindSET について報告する。
注釈付きデータセットには、以前のベンチマークの2倍以上の大きさの7つのメンタルヘルス条件にわたる textbf13M アノテーション付きポストが含まれている。
論文 参考訳(メタデータ) (2025-11-14T16:06:04Z) - Toward Human-Centered Readability Evaluation [0.0]
HCRS(Human-Centered Readability Score)は、Human-Computer Interaction (HCI)とHealth Communications研究に基づく5次元評価フレームワークである。
HCRSは、可読性と可読性の文脈的側面を捉えるために、構造化された人間のフィードバックと自動測度を統合している。
本研究は, 多様なユーザニーズ, 期待, 生きた経験とより密に整合したNLPシステムを実現することにより, 表面的指標を超えて, 健康テキストの簡易化を評価することを目的としている。
論文 参考訳(メタデータ) (2025-10-12T20:38:32Z) - A scale of conceptual orality and literacy: Automatic text categorization in the tradition of "Nähe und Distanz" [0.0]
言語的特徴により、概念的オリティーと識字率の尺度でテキストを評価できることが規定されている。
本稿では,PCAをベースとしたスケールを確立し,自動解析と組み合わせる。
このスケールは、コーパスコンパイルでの使用や、より大きなコーパスでの分析ガイドとしての利用についても論じられている。
論文 参考訳(メタデータ) (2025-02-05T15:08:37Z) - Bridging Context Gaps: Enhancing Comprehension in Long-Form Social Conversations Through Contextualized Excerpts [17.33980126041374]
我々は,小グループ会話における理解度の向上に焦点をあてた。
我々は、理解、可読性、共感を改善するために効果的な文脈化のためのアプローチを示す。
今後の作業をサポートするために、Human-annotated Salient Excerptsデータセットをリリースします。
論文 参考訳(メタデータ) (2024-12-28T01:29:53Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level
Quality [123.97136358092585]
我々は、ベンチマークデータセット上で人間レベルの品質を実現するNaturalSpeechと呼ばれるTSシステムを開発した。
具体的には、波形生成のための変分オートエンコーダ(VAE)を利用する。
LJSpeechデータセットを用いた実験により,提案したNaturalSpeechは文レベルでの人間の記録に対して-0.01CMOSを達成した。
論文 参考訳(メタデータ) (2022-05-09T16:57:35Z) - Quasi Error-free Text Classification and Authorship Recognition in a
large Corpus of English Literature based on a Novel Feature Set [0.0]
GLECの準誤りのないテキスト分類とオーサシップ認識は,同一の5つのスタイルと5つのコンテンツ特徴を用いた手法で可能であることを示す。
我々のデータは、心理学を読むための文学や実験の、多くの未来の計算および実証的研究の道を開く。
論文 参考訳(メタデータ) (2020-10-21T07:39:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。