論文の概要: Multi-aspect Multilingual and Cross-lingual Parliamentary Speech
Analysis
- arxiv url: http://arxiv.org/abs/2207.01054v1
- Date: Sun, 3 Jul 2022 14:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 14:46:12.201939
- Title: Multi-aspect Multilingual and Cross-lingual Parliamentary Speech
Analysis
- Title(参考訳): 多言語多言語・多言語議会音声分析
- Authors: Kristian Miok, Encarnacion Hidalgo-Tenorio, Petya Osenova,
Miguel-Angel Benitez-Castro and Marko Robnik-Sikonja
- Abstract要約: 均一な方法論を用いて、議論されたトピック、感情、感情を分析します。
話者の年齢、性別、政治的指向を音声から検出できるかどうかを評価する。
- 参考スコア(独自算出の注目度): 1.759288298635146
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parliamentary and legislative debate transcripts provide an exciting insight
into elected politicians' opinions, positions, and policy preferences. They are
interesting for political and social sciences as well as linguistics and
natural language processing (NLP). Exiting research covers discussions within
individual parliaments. In contrast, we apply advanced NLP methods to a joint
and comparative analysis of six national parliaments (Bulgarian, Czech, French,
Slovene, Spanish, and United Kingdom) between 2017 and 2020, whose transcripts
are a part of the ParlaMint dataset collection. Using a uniform methodology, we
analyze topics discussed, emotions, and sentiment. We assess if the age,
gender, and political orientation of speakers can be detected from speeches.
The results show some commonalities and many surprising differences among the
analyzed countries.
- Abstract(参考訳): 議会と立法の議論の写しは、選出された政治家の意見、地位、および政策の好みに関するエキサイティングな洞察を与える。
政治・社会科学だけでなく、言語学や自然言語処理(nlp)にも興味がある。
離脱研究は個々の議会の議論を扱っている。
対照的に、我々は2017年から2020年にかけて、6つの国民議会(ブルガリア、チェコ、フランス、スロベニア、スペイン、イギリス)の合同および比較分析に高度なNLP手法を適用し、その写本はParlaMintデータセットコレクションの一部である。
統一的な方法論を用いて,議論される話題,感情,感情を分析する。
我々は,話者の年齢,性別,政治的指向が発話から検出できるかどうかを評価する。
その結果,分析国間での共通点や驚くべき相違点が認められた。
関連論文リスト
- Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Political claim identification and categorization in a multilingual
setting: First experiments [11.124149798170908]
本稿では,政治的クレーム分析の言語間予測のための異なる戦略について検討する。
我々は、2015年の難民危機で引き起こされた政策論争をカバーし、ドイツのデータセットであるDebateNet2.0で実験を行いました。
論文 参考訳(メタデータ) (2023-10-13T17:13:00Z) - Speaker attribution in German parliamentary debates with QLoRA-adapted
large language models [0.0]
我々は,2017-2021年のドイツ議会討論会において,大型言語モデルLlama 2の話者属性の自動化の可能性について検討した。
本稿の結果は,話者帰属の自動化における大規模言語モデルの能力に光を当て,政治談話の計算分析や意味的役割ラベルシステムの開発に期待できる道のりを明らかにした。
論文 参考訳(メタデータ) (2023-09-18T16:06:16Z) - The ParlaSent multilingual training dataset for sentiment identification
in parliamentary proceedings [4.450536872346658]
本論文は, 感情分類器の訓練に焦点をあてた一連の実験において, 感傷文の新たなデータセットを提案する。
本稿は、政治的科学応用のための最初のドメイン固有 LLM についても紹介し、さらに12億7千億のドメイン固有語を事前訓練した。
我々は,多言語モデルが未確認言語で非常によく機能し,他の言語からの付加データが対象の議会の結果を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-09-18T14:01:06Z) - XAI in Computational Linguistics: Understanding Political Leanings in
the Slovenian Parliament [4.721944974277117]
この研究は、議会の書き起こしを通じて政治的傾きを予測する機械学習モデルの開発と説明可能性について論じている。
我々は、スロベニア議会と欧州移民危機に関する熱い議論に集中しており、2014年から2020年までの書き起こしを行っている。
従来の機械学習モデルとトランスフォーマー言語モデルの両方を開発し、移民の話題に関する発言に基づいて、議会議員の左派または右派を予測した。
論文 参考訳(メタデータ) (2023-05-08T11:19:21Z) - BasqueParl: A Bilingual Corpus of Basque Parliamentary Transcriptions [3.4447242282168777]
バスク議会文書から新たに編纂されたコーパスの最初のバージョンをリリースする。
このコーパスはバスク語とスペイン語の重厚なコードスイッチングが特徴であり、バスク語やスペイン語のような対照的な言語で政治的言説を研究するための興味深い資源となっている。
論文 参考訳(メタデータ) (2022-05-03T14:02:24Z) - German Parliamentary Corpus (GerParCor) [63.17616047204443]
ドイツ議会法人(GerParCor)について紹介する
ゲルパーコール(GerParCor)は、3世紀から4カ国にかけてのドイツ語の議定書のジャンル別コーパスである。
すべてのプロトコルはspurCy3のNLPパイプラインによって前処理され、セッション日に関するメタデータが自動的にアノテートされる。
論文 参考訳(メタデータ) (2022-04-21T22:06:55Z) - Automatically Identifying Language Family from Acoustic Examples in Low
Resource Scenarios [48.57072884674938]
ディープラーニングを用いて言語類似性を解析する手法を提案する。
すなわち、Willernessデータセットのモデルをトレーニングし、その潜在空間が古典的な言語家族の発見とどのように比較されるかを調べる。
論文 参考訳(メタデータ) (2020-12-01T22:44:42Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。