論文の概要: Political claim identification and categorization in a multilingual
setting: First experiments
- arxiv url: http://arxiv.org/abs/2310.09256v1
- Date: Fri, 13 Oct 2023 17:13:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 11:50:14.168245
- Title: Political claim identification and categorization in a multilingual
setting: First experiments
- Title(参考訳): 多言語環境における政治的クレームの識別と分類:最初の実験
- Authors: Urs Zaberer and Sebastian Pad\'o and Gabriella Lapesa
- Abstract要約: 本稿では,政治的クレーム分析の言語間予測のための異なる戦略について検討する。
我々は、2015年の難民危機で引き起こされた政策論争をカバーし、ドイツのデータセットであるDebateNet2.0で実験を行いました。
- 参考スコア(独自算出の注目度): 11.124149798170908
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The identification and classification of political claims is an important
step in the analysis of political newspaper reports; however, resources for
this task are few and far between. This paper explores different strategies for
the cross-lingual projection of political claims analysis. We conduct
experiments on a German dataset, DebateNet2.0, covering the policy debate
sparked by the 2015 refugee crisis. Our evaluation involves two tasks (claim
identification and categorization), three languages (German, English, and
French) and two methods (machine translation -- the best method in our
experiments -- and multilingual embeddings).
- Abstract(参考訳): 政治的クレームの識別と分類は、政治新聞の分析において重要なステップであるが、このタスクのリソースはほとんどない。
本稿では,政治的クレーム分析の言語間予測のための異なる戦略について検討する。
我々は、2015年の難民危機で引き起こされた政策論争をカバーし、ドイツのデータセットであるDebateNet2.0で実験を行いました。
評価には2つのタスク(認識と分類)、3つの言語(ドイツ語、英語、フランス語)、2つのメソッド(実験で最良の機械翻訳、多言語埋め込み)がある。
関連論文リスト
- Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - The ParlaSent Multilingual Training Dataset for Sentiment Identification in Parliamentary Proceedings [0.0]
そこで本論文では,感傷的に手動で注釈付けした7言語による文のトレーニングデータセットを提案する。
さらに、政治科学応用のためのドメイン固有多言語トランスフォーマー言語モデルについても紹介する。
論文 参考訳(メタデータ) (2023-09-18T14:01:06Z) - Towards Best Practices for Training Multilingual Dense Retrieval Models [54.91016739123398]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。
本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文 参考訳(メタデータ) (2022-04-05T17:12:53Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - Between welcome culture and border fence. A dataset on the European
refugee crisis in German newspaper reports [12.752057567551015]
本稿は、2015年のドイツの品質新聞「タズ」における欧州難民危機に関する政治的議論を辿るDebateNet2.0を紹介する。
私たちのアノテーションの中核的な単位は、政治的主張(政策分野内で取るべき特定の行動の要求)とそれらを作る俳優(政治家、政党など)である。
論文 参考訳(メタデータ) (2021-11-19T10:34:23Z) - Deriving Disinformation Insights from Geolocalized Twitter Callouts [7.951685935253415]
本稿では,地理空間分類と埋め込み型言語モデリングの組み合わせを応用して,偽情報に関連するソーシャルメディアデータから洞察を得る2段階の手法を示す。
TwitterデータはBERTを使用してヨーロッパと非ヨーロッパに分類される。
Word2vecは、Eurocentric, non-Eurocentric and global representations of the data for the three target languagesである。
論文 参考訳(メタデータ) (2021-08-06T11:39:05Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z) - A Call for More Rigor in Unsupervised Cross-lingual Learning [76.6545568416577]
このような研究の既存の理論的根拠は、世界の多くの言語における並列データの欠如に基づいている。
並列データと豊富なモノリンガルデータのないシナリオは現実的には非現実的であると我々は主張する。
論文 参考訳(メタデータ) (2020-04-30T17:06:23Z) - On the Language Neutrality of Pre-trained Multilingual Representations [70.93503607755055]
語彙意味論に関して,多言語文脈埋め込みの言語中立性を直接的に検討する。
その結果、文脈埋め込みは言語ニュートラルであり、概して静的な単語型埋め込みよりも情報的であることがわかった。
本稿では,言語識別における最先端の精度に到達し,並列文の単語アライメントのための統計的手法の性能を一致させる方法について述べる。
論文 参考訳(メタデータ) (2020-04-09T19:50:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。