論文の概要: Optimizing text representations to capture (dis)similarity between
political parties
- arxiv url: http://arxiv.org/abs/2210.11989v1
- Date: Fri, 21 Oct 2022 14:24:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 14:52:12.427417
- Title: Optimizing text representations to capture (dis)similarity between
political parties
- Title(参考訳): 政党間の相似性を捉えるためのテキスト表現の最適化
- Authors: Tanise Ceron, Nico Blokker, Sebastian Pad\'o
- Abstract要約: 政党間の相互類似性をモデル化する問題を考察する。
我々の研究課題は、ロバストなテキスト表現を作成するのに必要な構造情報のレベルである。
我々は、2021年の連邦選挙におけるドイツの政党の宣言について、我々のモデルを評価した。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Even though fine-tuned neural language models have been pivotal in enabling
"deep" automatic text analysis, optimizing text representations for specific
applications remains a crucial bottleneck. In this study, we look at this
problem in the context of a task from computational social science, namely
modeling pairwise similarities between political parties. Our research question
is what level of structural information is necessary to create robust text
representation, contrasting a strongly informed approach (which uses both claim
span and claim category annotations) with approaches that forgo one or both
types of annotation with document structure-based heuristics. Evaluating our
models on the manifestos of German parties for the 2021 federal election. We
find that heuristics that maximize within-party over between-party similarity
along with a normalization step lead to reliable party similarity prediction,
without the need for manual annotation.
- Abstract(参考訳): 自動テキスト解析を可能にする上では、微調整されたニューラルネットワークモデルが重要な役割を担ってきたが、特定のアプリケーションに対するテキスト表現の最適化は依然として重要なボトルネックである。
本研究では,この問題を,計算社会科学の課題,すなわち政党間の相互類似性をモデル化する文脈において考察する。
本研究は,ロバストなテキスト表現を作成する上で,どのレベルの構造情報が必要なのかを問うとともに,文書構造に基づくヒューリスティックなアノテーションを1種類ないし2種類のアノテーションに置き換えるアプローチと,強い情報的アプローチ(クレームスパンとクレームカテゴリアノテーションの両方を使用する)を対比する。
2021年の連邦選挙におけるドイツ政党の宣言に関する我々のモデルを評価する。
当事者間の類似度を最大化するヒューリスティックスと正常化ステップは、手動のアノテーションを必要とせず、信頼できる当事者類似度予測につながる。
関連論文リスト
- How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Multilingual estimation of political-party positioning: From label
aggregation to long-input Transformers [3.651047982634467]
我々は、政党マニフェストの自動スケーリング分析に2つのアプローチを実装し、比較する。
このタスクは最先端のモデルによって効率よく解決でき、ラベルアグリゲーションが最良の結果をもたらすことが判明した。
論文 参考訳(メタデータ) (2023-10-19T08:34:48Z) - SenteCon: Leveraging Lexicons to Learn Human-Interpretable Language
Representations [51.08119762844217]
SenteConは、深層言語表現に人間の解釈可能性を導入する方法である。
SenteConは、下流タスクにおける予測性能にほとんど、あるいは全くコストをかからない高レベルな解釈性を提供する。
論文 参考訳(メタデータ) (2023-05-24T05:06:28Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - Improve Discourse Dependency Parsing with Contextualized Representations [28.916249926065273]
本稿では,異なるレベルの単位の文脈化表現を符号化するトランスフォーマーの活用を提案する。
記事間で共通に共有される記述パターンの観察に動機付けられ,談話関係の識別をシーケンスラベリングタスクとして扱う新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-04T14:35:38Z) - Two-stream Hierarchical Similarity Reasoning for Image-text Matching [66.43071159630006]
文脈情報を自動的に抽出する階層的類似性推論モジュールを提案する。
従来のアプローチでは、シングルストリームの類似性アライメントを学習することしか検討されていなかった。
イメージ・ツー・テキスト・レベルの類似性計算とテキスト・ツー・テキスト・レベルの類似性計算に画像・テキストマッチングを分解する2ストリームアーキテクチャを開発した。
論文 参考訳(メタデータ) (2022-03-10T12:56:10Z) - Contrastive Learning for Neural Topic Model [14.65513836956786]
敵対的トピックモデル(ATM)は、文書を別の異なるサンプルと区別することで、文書の意味パターンをうまくキャプチャすることができる。
最適化問題として識別目標を再定式化するための新しい手法を提案し,新しいサンプリング手法を設計する。
実験の結果、我々のフレームワークは3つの一般的なベンチマークデータセットにおいて、他の最先端のニューラルトピックモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-25T09:46:26Z) - Electoral Programs of German Parties 2021: A Computational Analysis Of
Their Comprehensibility and Likeability Based On SentiArt [0.0]
我々は、2021年の総選挙の前に発行された6つのドイツ政党の選挙プログラムを分析する。
SentiArtで計算されたテキストの読みやすさと感情のポテンシャルの新たな指標を用いて、プログラムの類似点と相違点に光を当てた。
彼らは、SPDとCDUのプログラムが理解しやすく、好まれる最良の機会があることを明らかにした。
論文 参考訳(メタデータ) (2021-09-26T05:27:14Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。