論文の概要: Automated stance detection in complex topics and small languages: the
challenging case of immigration in polarizing news media
- arxiv url: http://arxiv.org/abs/2305.13047v1
- Date: Mon, 22 May 2023 13:56:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 15:45:20.087634
- Title: Automated stance detection in complex topics and small languages: the
challenging case of immigration in polarizing news media
- Title(参考訳): 複雑な話題や小言語における自動姿勢検出 : ニュースメディアの分極化における移民の挑戦事例
- Authors: Mark Mets, Andres Karjus, Indrek Ibrus, Maximilian Schich
- Abstract要約: 本稿では,大規模言語モデルによる自動姿勢検出への適用性について検討する。
形態学的に複雑で、低資源の言語であり、社会文化的に複雑な話題である移民を含んでいる。
このケースでアプローチがうまくいけば、要求の少ないシナリオでも同じように、あるいはより良く実行されることが期待できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated stance detection and related machine learning methods can provide
useful insights for media monitoring and academic research. Many of these
approaches require annotated training datasets, which limits their
applicability for languages where these may not be readily available. This
paper explores the applicability of large language models for automated stance
detection in a challenging scenario, involving a morphologically complex,
lower-resource language, and a socio-culturally complex topic, immigration. If
the approach works in this case, it can be expected to perform as well or
better in less demanding scenarios. We annotate a large set of pro and
anti-immigration examples, and compare the performance of multiple language
models as supervised learners. We also probe the usability of ChatGPT as an
instructable zero-shot classifier for the same task. Supervised achieves
acceptable performance, and ChatGPT yields similar accuracy. This is promising
as a potentially simpler and cheaper alternative for text classification tasks,
including in lower-resource languages. We further use the best-performing model
to investigate diachronic trends over seven years in two corpora of Estonian
mainstream and right-wing populist news sources, demonstrating the
applicability of the approach for news analytics and media monitoring settings,
and discuss correspondences between stance changes and real-world events.
- Abstract(参考訳): 自動姿勢検出と関連する機械学習手法は、メディア監視と学術研究に有用な洞察を提供する。
これらのアプローチの多くは、アノテーション付きトレーニングデータセットを必要とする。
本稿では, 形態学的に複雑で低資源言語, 社会文化的に複雑な話題である移民を含む, 難しいシナリオにおける, 自動姿勢検出のための大規模言語モデルの適用性について検討する。
このケースでアプローチがうまくいけば、要求の少ないシナリオでも同じように、あるいはより良く実行されることが期待できる。
我々は,多くのproおよびanti-immigration例に注釈を付け,複数の言語モデルのパフォーマンスを教師付き学習者と比較した。
また,ChatGPTを同一タスクに対する命令可能なゼロショット分類器としての有用性についても検討する。
Supervisedは許容性能を達成し、ChatGPTも同様の精度を得る。
これは、低リソース言語を含むテキスト分類タスクの、よりシンプルで安価な代替案として期待されている。
さらに、エストニアの主流ニュースと右派ポピュリストニュースソースの2つのコーポラで7年間にわたるダイアクロニックトレンドを調査し、ニュース分析とメディア監視設定のアプローチの適用性を示し、スタンス変化と現実世界のイベントの対応について論じる。
関連論文リスト
- MENTOR: Multilingual tExt detectioN TOward leaRning by analogy [59.37382045577384]
本研究では,シーンイメージ内の視覚領域と見えない言語領域の両方を検出し,識別するフレームワークを提案する。
mentOR」は、ゼロショット学習と少数ショット学習の学習戦略を多言語シーンテキスト検出のために実現した最初の作品である。
論文 参考訳(メタデータ) (2024-03-12T03:35:17Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Controlling Extra-Textual Attributes about Dialogue Participants: A Case
Study of English-to-Polish Neural Machine Translation [4.348327991071386]
機械翻訳モデルは、英語からポーランド語に翻訳する際に、テキストコンテキストの特定の解釈を選択する必要がある。
本稿では,翻訳における属性の制御に幅広いアプローチを採用するケーススタディを提案する。
最高のモデルでは+5.81 chrF++/+6.03 BLEUが向上し、他のモデルでは競争性能が向上した。
論文 参考訳(メタデータ) (2022-05-10T08:45:39Z) - Towards Best Practices for Training Multilingual Dense Retrieval Models [54.91016739123398]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。
本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文 参考訳(メタデータ) (2022-04-05T17:12:53Z) - IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and
Languages [87.5457337866383]
画像認識言語理解評価ベンチマークについて紹介する。
IGLUEは、視覚的質問応答、クロスモーダル検索、グラウンドド推論、20言語にわたるグラウンドドエンターテイメントタスクをまとめて提供する。
翻訳-テストの転送はゼロショットの転送よりも優れており、少数ショットの学習は多くのタスクに役立てることが難しい。
論文 参考訳(メタデータ) (2022-01-27T18:53:22Z) - When Does Translation Require Context? A Data-driven, Multilingual
Exploration [71.43817945875433]
談話の適切な処理は機械翻訳(MT)の品質に大きく貢献する
文脈認識型MTにおける最近の研究は、評価中に少量の談話現象を標的にしようとしている。
談話現象のモデル性能を識別・評価するタグの集合である,多言語談話認識ベンチマークを開発した。
論文 参考訳(メタデータ) (2021-09-15T17:29:30Z) - Few-Shot Cross-Lingual Stance Detection with Sentiment-Based
Pre-Training [32.800766653254634]
本研究は,現在までの言語間スタンス検出に関する最も包括的な研究である。
6つの言語ファミリーの12言語で15の多様なデータセットを使用します。
実験では,新しいラベルエンコーダの追加を提案し,パターン探索トレーニングを構築した。
論文 参考訳(メタデータ) (2021-09-13T15:20:06Z) - Semi-automatic Generation of Multilingual Datasets for Stance Detection
in Twitter [9.359018642178917]
本稿では,Twitterにおける姿勢検出のための多言語データセットを得る手法を提案する。
ユーザベースの情報を利用して、大量のツイートを半自動でラベル付けします。
論文 参考訳(メタデータ) (2021-01-28T13:05:09Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。