論文の概要: Compositional Demographic Word Embeddings
- arxiv url: http://arxiv.org/abs/2010.02986v2
- Date: Thu, 29 Oct 2020 18:54:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 05:01:26.972093
- Title: Compositional Demographic Word Embeddings
- Title(参考訳): 合成デモグラフィック単語埋め込み
- Authors: Charles Welch, Jonathan K. Kummerfeld, Ver\'onica P\'erez-Rosas, Rada
Mihalcea
- Abstract要約: そこで本稿では,ユーザのための完全あるいは部分的な人口統計情報から構成的に派生した,人口動態特異的な単語表現を用いたパーソナライズされた単語埋め込みを提案する。
その結果, 言語モデルと単語関連性という2つの課題において, 人口統計学的に認識された単語表現が, 一般的な単語表現よりも優れていたことが示唆された。
- 参考スコア(独自算出の注目度): 41.89745054269992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word embeddings are usually derived from corpora containing text from many
individuals, thus leading to general purpose representations rather than
individually personalized representations. While personalized embeddings can be
useful to improve language model performance and other language processing
tasks, they can only be computed for people with a large amount of longitudinal
data, which is not the case for new users. We propose a new form of
personalized word embeddings that use demographic-specific word representations
derived compositionally from full or partial demographic information for a user
(i.e., gender, age, location, religion). We show that the resulting
demographic-aware word representations outperform generic word representations
on two tasks for English: language modeling and word associations. We further
explore the trade-off between the number of available attributes and their
relative effectiveness and discuss the ethical implications of using them.
- Abstract(参考訳): 単語の埋め込みは通常、多くの個人からのテキストを含むコーパスから派生し、個々のパーソナライズされた表現よりも汎用的な表現につながる。
パーソナライズされた埋め込みは、言語モデルのパフォーマンスやその他の言語処理タスクを改善するのに有用であるが、それは、大量の縦データを持つ人々に対してのみ計算できる。
本研究では,ユーザ(性別,年齢,位置,宗教など)に対して,全体的あるいは部分的な人口統計情報から構成的に派生した,人口統計学的単語表現を用いたパーソナライズド単語埋め込み方式を提案する。
その結果,言語モデルと単語関連性という2つの課題において,人口統計学的に認識された単語表現が汎用的な単語表現よりも優れていることを示す。
利用可能な属性の数とそれらの相対的有効性の間のトレードオフをさらに検討し、それらを使用する倫理的意味について論じる。
関連論文リスト
- Investigating Idiomaticity in Word Representations [9.208145117062339]
我々は2つの言語(英語とポルトガル語)における様々な水準の慣用性を持つ名詞に焦点をあてる。
そこで本研究では,各名詞の音韻性判定を含む最小対のデータセットについて,タイプレベルとトークンレベルの両方で示す。
AffinityとScaled similarityの詳細なメトリクスセットを定義し、モデルが慣用性の変化につながる可能性のある摂動に対してどれほど敏感であるかを判断する。
論文 参考訳(メタデータ) (2024-11-04T21:05:01Z) - Leverage Points in Modality Shifts: Comparing Language-only and
Multimodal Word Representations [0.8594140167290097]
マルチモーダル埋め込みは、テキストのみのモデルと比較して、言語の神経表現における意味情報を豊かにすることを目的としている。
本稿では,3つの視覚・言語モデルと3つのテキストのみモデルからの単語埋め込みと,静的・文脈的表現との比較を行った。
これは、46のセマンティックパラメータを含む言語表現に対する視覚的接地の効果に関する最初の大規模研究である。
論文 参考訳(メタデータ) (2023-06-04T12:53:12Z) - Multilingual Conceptual Coverage in Text-to-Image Models [98.80343331645626]
コンセプチュアル・カバー・アクロス言語(Conceptual Coverage Across Languages, CoCo-CroLa)とは、任意の生成的テキスト・画像システムにおいて、有形名詞の観点から学習言語に多言語対応を提供する程度をベンチマークする手法である。
各モデルについて、ソースコード中の一連の有形名詞に生成される画像の集団と、対象言語に翻訳された各名詞に生成された画像の集団とを比較することにより、ソース言語に対して与えられた対象言語の「概念的カバレッジ」を評価することができる。
論文 参考訳(メタデータ) (2023-06-02T17:59:09Z) - Interpretable Word Sense Representations via Definition Generation: The
Case of Semantic Change Analysis [3.515619810213763]
本稿では,文脈化された単語の用法を解釈可能な単語と単語感覚表現として自動生成する自然言語定義を提案する。
得られた感覚ラベルが、意味変化分析に既存のアプローチをより解釈可能なものにする方法を実証する。
論文 参考訳(メタデータ) (2023-05-19T20:36:21Z) - Logographic Information Aids Learning Better Representations for Natural
Language Inference [3.677231059555795]
本稿では,より優れた意味表現を学習する上で,言語モデルにログ情報を提供することのメリットを探求する新しい研究を提案する。
6つの言語で評価した結果,ロゴグラフシステムを持つ言語にマルチモーダル埋め込みを組み込むことによる大きなメリットが示唆された。
論文 参考訳(メタデータ) (2022-11-03T20:40:14Z) - Visual Comparison of Language Model Adaptation [55.92129223662381]
アダプタは、モデル適応のための軽量な代替品です。
本稿では,インタラクティブな視覚的説明手法について,いくつかの設計と代替案について論じる。
例えば、文脈0の埋め込みに従って言語脱バイアスタスクを訓練したアダプタが、新しいタイプのバイアスをもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-17T09:25:28Z) - Accurate Word Representations with Universal Visual Guidance [55.71425503859685]
本稿では,視覚指導から従来の単語埋め込みを視覚的に強調する視覚的表現法を提案する。
各単語が多様な関連画像に対応するマルチモーダルシードデータセットから,小型の単語画像辞書を構築する。
12の自然言語理解および機械翻訳タスクの実験により,提案手法の有効性と一般化能力がさらに検証された。
論文 参考訳(メタデータ) (2020-12-30T09:11:50Z) - Exploring the Value of Personalized Word Embeddings [41.89745054269992]
特定の心理言語カテゴリーに属する単語のサブセットは、ユーザ間で表現がより異なる傾向があることを示す。
個人化単語埋め込みを用いた言語モデルは、著者帰属に効果的に利用できることを示す。
論文 参考訳(メタデータ) (2020-11-11T20:23:09Z) - Probing Contextual Language Models for Common Ground with Visual
Representations [76.05769268286038]
我々は、マッチングと非マッチングの視覚表現を区別する上で、テキストのみの表現がいかに効果的かを評価するための探索モデルを設計する。
以上の結果から,言語表現だけでは,適切な対象カテゴリから画像パッチを検索する強力な信号が得られることがわかった。
視覚的に接地された言語モデルは、例えば検索においてテキストのみの言語モデルよりわずかに優れているが、人間よりもはるかに低い。
論文 参考訳(メタデータ) (2020-05-01T21:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。