論文の概要: YEZE at SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization via Heterogeneous Ensembling
- arxiv url: http://arxiv.org/abs/2605.06231v2
- Date: Fri, 08 May 2026 21:45:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 16:21:29.395246
- Title: YEZE at SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization via Heterogeneous Ensembling
- Title(参考訳): YEZE at SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization through Heterogeneous Ensembling (特集:情報ネットワーク)
- Authors: Fengze Guo, Yue Chang,
- Abstract要約: XLM-RoBERTa-largeとmDeBERTa-v3-baseを組み合わせた多言語事前学習モデルの異種アンサンブルを提案する。
本研究では,多タスク学習,翻訳に基づくデータ拡張,クラス重み付けなどの手法を用いて,重度ラベルの不均衡下での分類性能の向上を図る。
- 参考スコア(独自算出の注目度): 3.3438708071539445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents our system for SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization, which identifies polarized social media content in 22 languages through three subtasks: binary detection, target classification, and manifestation identification. We propose a heterogeneous ensemble of multilingual pretrained models, combining XLM-RoBERTa-large and mDeBERTa-v3-base. We investigate techniques such as multi-task learning, translation-based data augmentation, and class weighting to improve classification performance under severe label imbalance. Our findings indicate that independent task modeling combined with class weighting is more effective.
- Abstract(参考訳): 本稿では,セムエスバル2026タスク9:多言語・多文化・多言語オンライン分極の検出システムについて述べる。
XLM-RoBERTa-largeとmDeBERTa-v3-baseを組み合わせた多言語事前学習モデルの異種アンサンブルを提案する。
本研究では,多タスク学習,翻訳に基づくデータ拡張,クラス重み付けなどの手法を用いて,重度ラベルの不均衡下での分類性能の向上を図る。
その結果,クラス重み付けと独立タスクモデリングの併用がより効果的であることが示唆された。
関連論文リスト
- mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection [5.3677118215189585]
SemEval-2026 Task 9は多言語偏光検出に重点を置いている。
それは3つの軸に沿った多言語、多文化、多領域の分極、すなわち検出、型、および表現の識別をカバーしている。
我々は,このSemEvalタスクに対して,QLoRAパラメータ効率の高い微調整手法を用いて,配列分類タスクのための中規模のLLMを微調整した。
トレーニングデータは、匿名化、下ケース化、上ケース化、ホモグリフィドによるマルチリンガル(22言語)トレーニングセットを拡張し、検出をより堅牢にする。
論文 参考訳(メタデータ) (2026-05-04T15:08:24Z) - SemEval-2026 Task 7: Everyday Knowledge Across Diverse Languages and Cultures [93.36078244548077]
タスクデータは、手動で構築したBLEnDベンチマーク(Myung et al. 2024)の拡張バージョンで構成され、30以上の言語培養ペアをカバーする。
このタスクは厳密に評価のために設計されているため、参加者はトレーニング、微調整、数発の学習、その他のモデル修正のためにデータを使用することは許されなかった。
その結果を報告し、最も優れたシステムと最も広く採用されているアプローチについて分析する。
論文 参考訳(メタデータ) (2026-05-04T13:49:44Z) - SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization [47.011443052131376]
オンライン偏極検出タスクであるSemEval-2026 Task 9について述べる。
参加者は,(1)偏光の存在を検出すること,(2)偏光の種類を特定すること,(3)偏光の出現を認識すること,の3つのサブタスクにおいて,ラベルの予測を依頼された。
本稿では,各サブタスクや言語にまたがる最も一般的なアプローチと,最も効果的な手法を取り上げ,ベースラインの結果を報告する。
論文 参考訳(メタデータ) (2026-04-08T08:34:55Z) - SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detection [76.18321723846616]
タスクは7つの異なる言語ファミリーから30以上の言語をカバーしている。
データインスタンスは6つの感情クラスでマルチラベルされており、感情の強さに注釈を付けた11言語にデータセットが追加されている。
参加者は, (a) マルチラベル感情検出, (b) 感情強度スコア検出, (c) 言語間感情検出の3つのトラックでラベルの予測を依頼された。
論文 参考訳(メタデータ) (2025-03-10T12:49:31Z) - KInITVeraAI at SemEval-2023 Task 3: Simple yet Powerful Multilingual
Fine-Tuning for Persuasion Techniques Detection [0.0]
本稿では,サブタスク3のSemEval 2023タスク3に対して,説得技術検出専用の最高のパフォーマンスソリューションを提案する。
入力データの多言語的特性が高く,23の予測ラベルが多数存在するため,学習前のトランスフォーマベース言語モデルに微調整を施した。
論文 参考訳(メタデータ) (2023-04-24T09:06:43Z) - Hitachi at SemEval-2023 Task 3: Exploring Cross-lingual Multi-task
Strategies for Genre and Framing Detection in Online News [10.435874177179764]
本稿では,日立チームによるSemEval-2023タスク3への参加について解説する。
本研究では,事前学習した言語モデルの学習のための多言語・多タスク戦略について検討した。
結果からアンサンブルモデルを構築し,イタリアおよびロシアのジャンル分類サブタスクにおいて,マクロ平均F1スコアを達成した。
論文 参考訳(メタデータ) (2023-03-03T09:12:55Z) - 1Cademy at Semeval-2022 Task 1: Investigating the Effectiveness of
Multilingual, Multitask, and Language-Agnostic Tricks for the Reverse
Dictionary Task [13.480318097164389]
本稿では,SemEval2022タスクの逆辞書トラックに着目し,単語の埋め込みと辞書のグルースをマッチングする。
モデルは文の入力をSGNS、Char、Electraの3種類の埋め込みに変換する。
提案するElmoベースの単言語モデルが最も高い結果を得る。
論文 参考訳(メタデータ) (2022-06-08T06:39:04Z) - xGQA: Cross-Lingual Visual Question Answering [100.35229218735938]
xGQAは視覚的質問応答タスクのための新しい多言語評価ベンチマークである。
確立された英語GQAデータセットを7言語に拡張する。
本稿では,マルチモーダルトランスフォーマーモデルに適応するアダプタベースの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-13T15:58:21Z) - Explicit Alignment Objectives for Multilingual Bidirectional Encoders [111.65322283420805]
本稿では,多言語エンコーダAMBER(Aligned Multilingual Bi-directional EncodeR)の学習方法を提案する。
AMBERは、異なる粒度で多言語表現を整列する2つの明示的なアライメント目標を使用して、追加の並列データに基づいて訓練される。
実験結果から、AMBERは、シーケンスタグ付けで1.1平均F1スコア、XLMR-大規模モデル上での検索で27.3平均精度を得ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T18:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。