論文の概要: MKJ at SemEval-2026 Task 9: A Comparative Study of Generalist, Specialist, and Ensemble Strategies for Multilingual Polarization
- arxiv url: http://arxiv.org/abs/2604.21370v1
- Date: Thu, 23 Apr 2026 07:34:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.36495
- Title: MKJ at SemEval-2026 Task 9: A Comparative Study of Generalist, Specialist, and Ensemble Strategies for Multilingual Polarization
- Title(参考訳): MKJ at SemEval-2026 Task 9: A Comparison Study of Generalist, Specialist, and Ensemble Strategies for Multilingual Polarization (特集:一般)
- Authors: Maziar Kianimoghadam Jouneghani,
- Abstract要約: 本研究では,SemEval-2026タスク9(Subtask 1)における22言語間の多言語分極検出の系統的研究を行う。
単一のユニバーサルアーキテクチャを強制するのではなく、多言語ジェネラリスト、言語固有のスペシャリスト、および開発パフォーマンスに基づいたハイブリッドアンサンブルを切り替える言語適応フレームワークを採用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a systematic study of multilingual polarization detection across 22 languages for SemEval-2026 Task 9 (Subtask 1), contrasting multilingual generalists with language-specific specialists and hybrid ensembles. While a standard generalist like XLM-RoBERTa suffices when its tokenizer aligns with the target text, it may struggle with distinct scripts (e.g., Khmer, Odia) where monolingual specialists yield significant gains. Rather than enforcing a single universal architecture, we adopt a language-adaptive framework that switches between multilingual generalists, language-specific specialists, and hybrid ensembles based on development performance. Additionally, cross-lingual augmentation via NLLB-200 yielded mixed results, often underperforming native architecture selection and degrading morphologically rich tracks. Our final system achieves an overall macro-averaged F1 score of 0.796 and an average accuracy of 0.826 across all 22 tracks. Code and final test predictions are publicly available at: https://github.com/Maziarkiani/SemEval2026-Task9-Subtask1-Polarization.
- Abstract(参考訳): 本研究では,SemEval-2026 Task 9(Subtask 1)における22言語間の多言語分極検出の体系的研究を行い,言語固有の専門家やハイブリッドアンサンブルとの対比を行った。
XLM-RoBERTaのような標準的なジェネラリストは、トークン化ツールがターゲットのテキストと整列するときに十分であるが、モノリンガルの専門家が大きな利益をもたらす異なるスクリプト(例えば、Khmer、Odia)と競合する可能性がある。
単一のユニバーサルアーキテクチャを強制するのではなく、多言語ジェネラリスト、言語固有のスペシャリスト、および開発パフォーマンスに基づいたハイブリッドアンサンブルを切り替える言語適応フレームワークを採用する。
さらに、NLLB-200による言語間の拡張により、混合結果が得られ、しばしばネイティブアーキテクチャの選択が低下し、形態学的にリッチなトラックが劣化した。
最終システムは、マクロ平均F1スコアが0.796、平均精度が0.826である。
コードと最終的なテスト予測は、https://github.com/Maziarkiani/SemEval2026-Task9-Subtask1-Polarizationで公開されている。
関連論文リスト
- One ruler to measure them all: Benchmarking multilingual long-context language models [31.669282956425658]
我々は26言語にわたる長文言語モデルを評価するために設計された多言語ベンチマークONERULERを提案する。
英語は、長文タスク(26語中6位)における最高のパフォーマンス言語ではなく、ポーランド語が最上位言語として登場した。
異なる言語で命令とコンテキストが現れる言語間シナリオでは、命令言語によってパフォーマンスが最大20%変動する。
論文 参考訳(メタデータ) (2025-03-03T19:12:48Z) - Breaking Language Barriers in Multilingual Mathematical Reasoning: Insights and Observations [59.056367787688146]
本稿では, マルチリンガル数学推論 (xMR) LLM の探索と学習の先駆者である。
我々は10の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
翻訳を利用して、10個の異なる言語を含む最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
論文 参考訳(メタデータ) (2023-10-31T08:09:20Z) - TGIF: Tree-Graph Integrated-Format Parser for Enhanced UD with Two-Stage
Generic- to Individual-Language Finetuning [18.71574180551552]
IWPT 2021共有タスクへのコントリビューションについて述べる。
我々のメインシステムコンポーネントはハイブリッドツリーグラフであり、スプレッドツリーに存在しないグラフエッジを付加した拡張グラフに対して、スプレッドツリーの予測を統合する。
論文 参考訳(メタデータ) (2021-07-14T18:00:08Z) - NEMO: Frequentist Inference Approach to Constrained Linguistic Typology
Feature Prediction in SIGTYP 2020 Shared Task [83.43738174234053]
タイプ的特徴間の相関関係を表現するために頻繁な推論を用い、この表現を用いて、個々の特徴を予測する単純なマルチクラス推定器を訓練する。
テスト言語149言語に対して,マイクロ平均精度0.66を達成できた。
論文 参考訳(メタデータ) (2020-10-12T19:25:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。