論文の概要: Multilingual Target-Stance Extraction
- arxiv url: http://arxiv.org/abs/2510.22334v1
- Date: Sat, 25 Oct 2025 15:38:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.102293
- Title: Multilingual Target-Stance Extraction
- Title(参考訳): 多言語ターゲット・スタンス抽出
- Authors: Ethan Mines, Bonnie Dorr,
- Abstract要約: TSE(Target-Stance extract)は、文書で議論されたターゲットと、そのターゲットに対する文書のスタンスを特定するタスクである。
多くの作品は、多言語設定で与えられた目標に対するスタンスを分類するが、TSEにおける以前の作業はすべて英語のみである。
この研究は、カタルーニャ、エストニア、フランス、イタリア、マンダリン、スペインのコーパスにまたがる最初の多言語TSEベンチマークを導入している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Social media enables data-driven analysis of public opinion on contested issues. Target-Stance Extraction (TSE) is the task of identifying the target discussed in a document and the document's stance towards that target. Many works classify stance towards a given target in a multilingual setting, but all prior work in TSE is English-only. This work introduces the first multilingual TSE benchmark, spanning Catalan, Estonian, French, Italian, Mandarin, and Spanish corpora. It manages to extend the original TSE pipeline to a multilingual setting without requiring separate models for each language. Our model pipeline achieves a modest F1 score of 12.78, underscoring the increased difficulty of the multilingual task relative to English-only setups and highlighting target prediction as the primary bottleneck. We are also the first to demonstrate the sensitivity of TSE's F1 score to different target verbalizations. Together these serve as a much-needed baseline for resources, algorithms, and evaluation criteria in multilingual TSE.
- Abstract(参考訳): ソーシャルメディアは、議論された問題に関する世論の分析を可能にする。
TSE(Target-Stance extract)は、文書で議論されたターゲットと、そのターゲットに対する文書のスタンスを特定するタスクである。
多くの作品は、多言語設定で与えられた目標に対するスタンスを分類するが、TSEにおける以前の作業はすべて英語のみである。
この研究は、カタルーニャ、エストニア、フランス、イタリア、マンダリン、スペインのコーパスにまたがる最初の多言語TSEベンチマークを導入している。
オリジナルのTSEパイプラインを、言語毎に別々のモデルを必要とせずに、多言語設定に拡張することに成功した。
我々のモデルパイプラインは、英語のみのセットアップと比較して多言語タスクの難易度を高め、ターゲット予測を主要なボトルネックとして強調し、控えめなF1スコアの12.78を達成する。
また,TSEのF1スコアの異なる目的語に対する感度を初めて示す。
これらを合わせると、多言語TSEにおけるリソース、アルゴリズム、評価基準のための、待望のベースラインとして機能する。
関連論文リスト
- Analyzing the Effect of Linguistic Similarity on Cross-Lingual Transfer: Tasks and Experimental Setups Matter [5.237387600625361]
低リソース環境下でのNLPタスクのトレーニングデータ量を増やすために、言語間転送が一般的なアプローチである。
本研究では,263言語間の言語間移動を多種多様な言語群から分析する。
論文 参考訳(メタデータ) (2025-01-24T13:48:10Z) - An Initial Investigation of Language Adaptation for TTS Systems under Low-resource Scenarios [76.11409260727459]
本稿では,最近のSSLベースの多言語TSシステムであるZMM-TTSの言語適応性について検討する。
本研究では,事前学習言語と対象言語との音声学的な類似性が,対象言語の適応性能に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-06-13T08:16:52Z) - ZGUL: Zero-shot Generalization to Unseen Languages using Multi-source
Ensembling of Language Adapters [29.211715245603234]
我々は、言語アダプタ(LA)を用いて、NLPタスクにおけるゼロショット言語間移動の問題に取り組む。
トレーニング対象のLAはラベルのないデータを必要とするが、リソースの低い言語では簡単には利用できない。
ZGULを(1)ラベルのないデータか(2)ターゲット言語で使用可能な数ショットのトレーニング例のどちらかに拡張します。
論文 参考訳(メタデータ) (2023-10-25T06:22:29Z) - Efficiently Aligned Cross-Lingual Transfer Learning for Conversational
Tasks using Prompt-Tuning [98.60739735409243]
英語のような高リソース言語で訓練された言語モデルの言語間移動は、多くのNLPタスクのために広く研究されている。
並列および大規模多言語会話データセットである言語間アライメント事前学習のためのXSGDを導入する。
協調的な言語間表現を容易にするために,アライメントプロンプトを学習するための効率的なプロンプトチューニング手法を開発した。
論文 参考訳(メタデータ) (2023-04-03T18:46:01Z) - Por Qu\'e N\~ao Utiliser Alla Spr{\aa}k? Mixed Training with Gradient
Optimization in Few-Shot Cross-Lingual Transfer [2.7213511121305465]
本研究では,ソースデータとターゲットデータの両方を学習する1ステップ混合学習手法を提案する。
我々は1つのモデルを使って全てのターゲット言語を同時に処理し、過度に言語固有のモデルを避ける。
提案手法は,全タスクの最先端性能と目標適応性能を高いマージンで向上させる。
論文 参考訳(メタデータ) (2022-04-29T04:05:02Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。
多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文 参考訳(メタデータ) (2022-02-15T18:22:18Z) - Modeling Profanity and Hate Speech in Social Media with Semantic
Subspaces [15.457286059556393]
特に英語以外の言語では、憎しみの言葉と憎しみの検知は、データの拡散に悩まされる。
代名詞部分空間を単語と文表現で識別し,その一般化能力を探求する。
類似したタスクと遠方のタスク、およびすべての言語において、サブスペースベースの表現は標準のBERT表現よりも効果的に転送される。
論文 参考訳(メタデータ) (2021-06-14T15:34:37Z) - Analysing The Impact Of Linguistic Features On Cross-Lingual Transfer [3.299672391663527]
我々は、最先端の多言語モデルを分析し、言語間の良い伝達に何が影響するかを判断する。
また,特定の構文特徴を見ることは,構文的類似性の集合よりも,性能予測に2~4倍有益であることを示す。
論文 参考訳(メタデータ) (2021-05-12T21:22:58Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。