論文の概要: Constructing Vec-tionaries to Extract Latent Message Features from
Texts: A Case Study of Moral Appeals
- arxiv url: http://arxiv.org/abs/2312.05990v1
- Date: Sun, 10 Dec 2023 20:37:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 17:43:37.489086
- Title: Constructing Vec-tionaries to Extract Latent Message Features from
Texts: A Case Study of Moral Appeals
- Title(参考訳): テキストから遅延メッセージの特徴を抽出するベクティナリーの構築:道徳的アピールを事例として
- Authors: Zening Duan, Anqi Shao, Yicheng Hu, Heysung Lee, Xining Liao, Yoo Ji
Suh, Jisoo Kim, Kai-Cheng Yang, Kaiping Chen, and Sijia Yang
- Abstract要約: Vec-tionaryは、元の語彙の適用範囲を広げることで、潜時メッセージの特徴の測定を改善する。
Vec-tionariesはテキスト、特に短いフォーマットのテキストから意味情報を抽出するのに役立つ。
- 参考スコア(独自算出の注目度): 5.336592570916432
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While communication research frequently studies latent message features like
moral appeals, their quantification remains a challenge. Conventional human
coding struggles with scalability and intercoder reliability. While
dictionary-based methods are cost-effective and computationally efficient, they
often lack contextual sensitivity and are limited by the vocabularies developed
for the original applications. In this paper, we present a novel approach to
construct vec-tionary measurement tools that boost validated dictionaries with
word embeddings through nonlinear optimization. By harnessing semantic
relationships encoded by embeddings, vec-tionaries improve the measurement of
latent message features by expanding the applicability of original vocabularies
to other contexts. Vec-tionaries can also help extract semantic information
from texts, especially those in short format, beyond the original vocabulary of
a dictionary. Importantly, a vec-tionary can produce additional metrics to
capture the valence and ambivalence of a latent feature beyond its strength in
texts. Using moral appeals in COVID-19-related tweets as a case study, we
illustrate the steps to construct the moral foundations vec-tionary, showcasing
its ability to process posts missed by dictionary methods and to produce
measurements better aligned with crowdsourced human assessments. Furthermore,
additional metrics from the moral foundations vec-tionary unveiled unique
insights that facilitated predicting outcomes such as message retransmission.
- Abstract(参考訳): コミュニケーション研究は、道徳的アピールのような潜在メッセージの特徴をしばしば研究しているが、その定量化は依然として課題である。
従来のヒューマンコーディングはスケーラビリティとインターコーダの信頼性に苦しむ。
辞書ベースの手法はコスト効率と計算効率が良いが、文脈感度に欠けることが多く、本来の用途で開発された語彙によって制限される。
本稿では,非線形最適化による単語埋め込みによる検証辞書の高速化を目的とした,ベクトル定値測定ツールの構築手法を提案する。
埋め込みによって符号化される意味関係を利用することにより、vec-tionaryは、元の語彙を他の文脈に適用する可能性を広げることで、潜在メッセージ特徴の測定を改善する。
Vec-tionariesは、辞書の本来の語彙を超えて、テキスト、特に短いフォーマットのテキストから意味情報を抽出するのに役立つ。
重要なことに、vec-tionaryは、テキストの強み以上の潜在機能の価値とあいまいさを捉えるために、追加のメトリクスを生成することができる。
新型コロナウイルス関連ツイートの道徳的魅力を事例研究として、倫理的基盤を構築するためのステップを解説し、辞書の手法で欠落した投稿を処理し、クラウドソースされた人的評価に適合した測定結果を作成する能力を示す。
さらに、道徳的基礎からのさらなるメトリクスは、メッセージの再送のような予測結果を促進するユニークな洞察を明らかにした。
関連論文リスト
- Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - Integrating Bidirectional Long Short-Term Memory with Subword Embedding
for Authorship Attribution [2.3429306644730854]
マニフォールド語に基づくスタイリスティックマーカーは、著者帰属の本質的な問題に対処するために、ディープラーニング手法でうまく使われてきた。
提案手法は,CCAT50,IMDb62,Blog50,Twitter50の公営企業における最先端手法に対して実験的に評価された。
論文 参考訳(メタデータ) (2023-06-26T11:35:47Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Dictionary-Assisted Supervised Contrastive Learning [0.0]
本稿では,辞書支援型教師付きコントラスト学習(DASCL)の目的について紹介する。
共通の固定トークンは、関心の概念に関連する辞書(ies)に現れるコーパス内の任意の単語を置き換える。
DASCLとクロスエントロピーは、数ショットの学習設定と社会科学応用における分類性能指標を改善する。
論文 参考訳(メタデータ) (2022-10-27T04:57:43Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - Improving Text Generation Evaluation with Batch Centering and Tempered
Word Mover Distance [24.49032191669509]
類似度指標の符号化表現を改善するための2つの手法を提案する。
さまざまなBERTバックボーンの学習指標について結果を示し、複数のベンチマークでヒトのレーティングとアート相関の状態を達成した。
論文 参考訳(メタデータ) (2020-10-13T03:46:25Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - A Common Semantic Space for Monolingual and Cross-Lingual
Meta-Embeddings [10.871587311621974]
本稿では,モノリンガルおよびクロスリンガルなメタ埋め込みを作成するための新しい手法を提案する。
既存のワードベクトルは線形変換と平均化を用いて共通の意味空間に投影される。
結果として得られる言語間メタ埋め込みは、優れた言語間移動学習能力を示す。
論文 参考訳(メタデータ) (2020-01-17T15:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。