論文の概要: NRC VAD Lexicon v2: Norms for Valence, Arousal, and Dominance for over 55k English Terms
- arxiv url: http://arxiv.org/abs/2503.23547v1
- Date: Sun, 30 Mar 2025 18:07:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 19:35:57.184142
- Title: NRC VAD Lexicon v2: Norms for Valence, Arousal, and Dominance for over 55k English Terms
- Title(参考訳): NRC VAD Lexicon v2: Norms for Valence, Arousal, and Dominance for more 55k English terms
- Authors: Saif M. Mohammad,
- Abstract要約: 学会の信頼性は高い。
この辞書は心理学、NLP、公衆衛生、デジタル人文科学、社会科学の幅広い研究を可能にする。
- 参考スコア(独自算出の注目度): 35.0834082343387
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Factor analysis studies have shown that the primary dimensions of word meaning are Valence (V), Arousal (A), and Dominance (D) (also referred to in social cognition research as Competence (C)). These dimensions impact various aspects of our lives from social competence and emotion regulation to success in the work place and how we view the world. We present here the NRC VAD Lexicon v2, which has human ratings of valence, arousal, and dominance for more than 55,000 English words and phrases. Notably, it adds entries for $\sim$25k additional words to v1.0. It also now includes for the first time entries for common multi-word phrases (~10k). We show that the associations are highly reliable. The lexicon enables a wide variety of research in psychology, NLP, public health, digital humanities, and social sciences. The NRC VAD Lexicon v2 is made freely available for research through our project webpage.
- Abstract(参考訳): 因子分析により、単語の意味の主次元は、V(V)、A(A)、D(D)であることが明らかとなった(社会認知研究では、コンピテンス(C)とも呼ばれる)。
これらの次元は、社会的能力や感情の規制から職場の成功、世界をどのように見ているかに至るまで、私たちの生活の様々な側面に影響を与える。
NRC VAD Lexicon v2は,55,000以上の英語の単語とフレーズに対して,人間の評価値,覚醒度,優位性を有する。
特に、$\sim$25kの追加語をv1.0に追加する。
また、一般的な複数単語のフレーズ(~10k)のエントリも含むようになった。
学会の信頼性は高い。
この辞書は心理学、NLP、公衆衛生、デジタル人文科学、社会科学の幅広い研究を可能にする。
NRC VAD Lexicon v2は、我々のプロジェクトWebページを通じて自由に研究することができる。
関連論文リスト
- Translate to Disambiguate: Zero-shot Multilingual Word Sense
Disambiguation with Pretrained Language Models [67.19567060894563]
事前訓練された言語モデル(PLM)は、豊富な言語間知識を学習し、多様なタスクでうまく機能するように微調整することができる。
C-WLT(Contextual Word-Level Translation)を用いた言語間単語感覚の捉え方の検討を行った。
モデルのサイズが大きくなるにつれて、PLMはより言語間単語認識の知識をエンコードし、WLT性能を改善するためのコンテキストを良くする。
論文 参考訳(メタデータ) (2023-04-26T19:55:52Z) - Evaluation of Word Embeddings for the Social Sciences [0.0]
本稿では,37,604の社会科学研究論文に基づく単語埋め込みモデルの作成と評価について述べる。
作成したドメイン固有モデルは,社会科学の概念の大部分をカバーしていることがわかった。
すべての関係型において、意味的関係をより広範囲に網羅している。
論文 参考訳(メタデータ) (2023-02-13T08:23:03Z) - Gender Bias in Word Embeddings: A Comprehensive Analysis of Frequency,
Syntax, and Semantics [3.4048739113355215]
インターネットコーパスで学習した英語の静的単語埋め込みにおいて,グループベースのバイアスを包括的に分析する。
単一カテゴリー単語埋め込みアソシエーションテストを用いて,性別バイアスの広範性を示す。
語彙の中で最も頻繁な単語1,000のうち、77%が女性よりも男性に関連があることがわかりました。
論文 参考訳(メタデータ) (2022-06-07T15:35:10Z) - An Automated Method to Enrich Consumer Health Vocabularies Using GloVe
Word Embeddings and An Auxiliary Lexical Resource [0.0]
平民は、ドメインに共通する専門用語を理解できないため、専門家とのコミュニケーションが困難になる可能性がある。
いくつかの専門用語は、平凡な医学用語を専門的な医学用語にマッピングするために作られており、その逆も同様である。
本稿では,どのドメインの語彙にも適用可能な,平民の語彙を豊かにするための自動手法を提案する。
論文 参考訳(メタデータ) (2021-05-18T20:16:45Z) - Disambiguatory Signals are Stronger in Word-initial Positions [48.18148856974974]
単語の初期と後期のセグメントの情報を比較するための既存の手法の相違点を指摘する。
何百もの言語にまたがって、言葉で情報を読み込むという言語横断的な傾向があるという証拠が見つかりました。
論文 参考訳(メタデータ) (2021-02-03T18:19:16Z) - A Comprehensive Dictionary and Term Variation Analysis for COVID-19 and
SARS-CoV-2 [6.527251100820119]
SARS-CoV-2(SARS-CoV-2)やCOVID-19(COVID-19)などを指す科学文献における独自の用語の数は、非常に多い。
この高度の項変動は、これらの重要なエンティティの高いリコール識別を困難にする。
文献ではSARS-CoV-2およびCOVID-19の用語の広範な辞書について紹介する。
論文 参考訳(メタデータ) (2020-10-27T19:51:53Z) - Probing Pretrained Language Models for Lexical Semantics [76.73599166020307]
類型的多様言語と5つの異なる語彙課題にまたがる系統的経験分析を行った。
我々の結果は、普遍的に維持されるパターンとベストプラクティスを示しているが、言語やタスクにまたがる顕著なバリエーションを示している。
論文 参考訳(メタデータ) (2020-10-12T14:24:01Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - ValNorm Quantifies Semantics to Reveal Consistent Valence Biases Across
Languages and Over Centuries [3.0349733976070015]
単語埋め込みは、単語共起統計によって得られた言語規則性から暗黙のバイアスを学ぶ。
単語埋め込みにおける人間のようなバイアスを定量化する手法を拡張することにより、本質的な評価課題であるValNormを導入する。
我々はValNormを7言語からの静的な単語埋め込みと200年に及ぶ歴史英語のテキストに適用する。
論文 参考訳(メタデータ) (2020-06-06T19:29:36Z) - Informational Space of Meaning for Scientific Texts [68.8204255655161]
本稿では,単語の意味を,テキストが属する対象カテゴリに関する相対情報ゲイン(RIG)のベクトルで表現する意味空間を紹介する。
Leicester Scientific Corpus (LSC) と Leicester Scientific Dictionary-Core (LScDC) に基づく意味空間の構築に本手法を適用した。
RIGに基づく提案モデルでは,カテゴリ内の話題特化語を際立たせる能力があることが示されている。
論文 参考訳(メタデータ) (2020-04-28T14:26:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。