論文の概要: Constructing Vec-tionaries to Extract Message Features from Texts: A
Case Study of Moral Appeals
- arxiv url: http://arxiv.org/abs/2312.05990v2
- Date: Sat, 9 Mar 2024 04:55:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 14:59:46.685179
- Title: Constructing Vec-tionaries to Extract Message Features from Texts: A
Case Study of Moral Appeals
- Title(参考訳): テキストからメッセージの特徴を抽出するベクティナリーの構築:道徳的アピールを事例として
- Authors: Zening Duan, Anqi Shao, Yicheng Hu, Heysung Lee, Xining Liao, Yoo Ji
Suh, Jisoo Kim, Kai-Cheng Yang, Kaiping Chen, and Sijia Yang
- Abstract要約: 本稿では,単語埋め込みによる検証辞書を向上するベクタリー測度ツールの構築手法を提案する。
vec-tionaryは、テキストの強みを超えてメッセージ機能のあいまいさを捉えるために、追加のメトリクスを生成することができる。
- 参考スコア(独自算出の注目度): 5.336592570916432
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While researchers often study message features like moral content in text,
such as party manifestos and social media, their quantification remains a
challenge. Conventional human coding struggles with scalability and intercoder
reliability. While dictionary-based methods are cost-effective and
computationally efficient, they often lack contextual sensitivity and are
limited by the vocabularies developed for the original applications. In this
paper, we present an approach to construct vec-tionary measurement tools that
boost validated dictionaries with word embeddings through nonlinear
optimization. By harnessing semantic relationships encoded by embeddings,
vec-tionaries improve the measurement of message features from text, especially
those in short format, by expanding the applicability of original vocabularies
to other contexts. Importantly, a vec-tionary can produce additional metrics to
capture the valence and ambivalence of a message feature beyond its strength in
texts. Using moral content in tweets as a case study, we illustrate the steps
to construct the moral foundations vec-tionary, showcasing its ability to
process texts missed by conventional dictionaries and word embedding methods
and to produce measurements better aligned with crowdsourced human assessments.
Furthermore, additional metrics from the vec-tionary unveiled unique insights
that facilitated predicting outcomes such as message retransmission.
- Abstract(参考訳): 研究者は、パーティーのマニフェストやソーシャルメディアなど、テキスト中のモラルコンテンツのようなメッセージ機能を研究することが多いが、その定量化は依然として課題である。
従来のヒューマンコーディングはスケーラビリティとインターコーダの信頼性に苦しむ。
辞書ベースの手法はコスト効率と計算効率が良いが、文脈感度に欠けることが多く、本来の用途で開発された語彙によって制限される。
本稿では,非線形最適化による単語埋め込みによる検証ディクショナリの促進を目的としたvec-tionary measurement toolsの構築手法を提案する。
埋め込みによって符号化される意味的関係を利用して、vec-tionaryは、テキスト、特に短いフォーマットのメッセージ特徴の測定を改善し、元の語彙を他の文脈に適用できるように拡張する。
重要なことに、vec-tionaryは、テキストの強み以上のメッセージ機能の価値とあいまいさを捉えるために、追加のメトリクスを生成することができる。
ツイートのモラルコンテンツを事例研究として,従来の辞書や単語の埋め込み手法で欠落したテキストを処理し,クラウドソースによる人的評価に適合した指標を作成する能力を示すとともに,道徳的基盤を構築するためのステップを解説する。
さらに、vec-tionaryから追加されたメトリクスは、メッセージの再送信などの予測結果を促進するユニークな洞察を公開した。
関連論文リスト
- Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - Integrating Bidirectional Long Short-Term Memory with Subword Embedding
for Authorship Attribution [2.3429306644730854]
マニフォールド語に基づくスタイリスティックマーカーは、著者帰属の本質的な問題に対処するために、ディープラーニング手法でうまく使われてきた。
提案手法は,CCAT50,IMDb62,Blog50,Twitter50の公営企業における最先端手法に対して実験的に評価された。
論文 参考訳(メタデータ) (2023-06-26T11:35:47Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Dictionary-Assisted Supervised Contrastive Learning [0.0]
本稿では,辞書支援型教師付きコントラスト学習(DASCL)の目的について紹介する。
共通の固定トークンは、関心の概念に関連する辞書(ies)に現れるコーパス内の任意の単語を置き換える。
DASCLとクロスエントロピーは、数ショットの学習設定と社会科学応用における分類性能指標を改善する。
論文 参考訳(メタデータ) (2022-10-27T04:57:43Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z) - Improving Text Generation Evaluation with Batch Centering and Tempered
Word Mover Distance [24.49032191669509]
類似度指標の符号化表現を改善するための2つの手法を提案する。
さまざまなBERTバックボーンの学習指標について結果を示し、複数のベンチマークでヒトのレーティングとアート相関の状態を達成した。
論文 参考訳(メタデータ) (2020-10-13T03:46:25Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - A Common Semantic Space for Monolingual and Cross-Lingual
Meta-Embeddings [10.871587311621974]
本稿では,モノリンガルおよびクロスリンガルなメタ埋め込みを作成するための新しい手法を提案する。
既存のワードベクトルは線形変換と平均化を用いて共通の意味空間に投影される。
結果として得られる言語間メタ埋め込みは、優れた言語間移動学習能力を示す。
論文 参考訳(メタデータ) (2020-01-17T15:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。