論文の概要: mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection
- arxiv url: http://arxiv.org/abs/2605.02695v1
- Date: Mon, 04 May 2026 15:08:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.355431
- Title: mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection
- Title(参考訳): mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection (英語)
- Authors: Dominik Macko, Alok Debnath, Jakub Simko,
- Abstract要約: SemEval-2026 Task 9は多言語偏光検出に重点を置いている。
それは3つの軸に沿った多言語、多文化、多領域の分極、すなわち検出、型、および表現の識別をカバーしている。
我々は,このSemEvalタスクに対して,QLoRAパラメータ効率の高い微調整手法を用いて,配列分類タスクのための中規模のLLMを微調整した。
トレーニングデータは、匿名化、下ケース化、上ケース化、ホモグリフィドによるマルチリンガル(22言語)トレーニングセットを拡張し、検出をより堅牢にする。
- 参考スコア(独自算出の注目度): 5.3677118215189585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SemEval-2026 Task 9 is focused on multilingual polarization detection. Specifically, it covers the identification of multilingual, multicultural and multievent polarization along three axes (in subtasks), namely detection, type, and manifestation. Online polarization presents a concern, because it is often followed by hate speech, offensive discourse, and social fragmentation. Therefore, its detection before it escalates is crucial for a safer and more inclusive online space. We have coped with this SemEval task by finetuning mid-size LLMs for the sequence-classification task using the QLoRA parameter-efficient finetuning technique. The training data augmented the multilingual (22 languages) training sets by anonymized, lower-cased, upper-cased, and homoglyphied counterparts, making the detection more robust.
- Abstract(参考訳): SemEval-2026 Task 9は多言語偏光検出に重点を置いている。
具体的には、3つの軸(サブタスク)に沿った多言語、多文化、多民族分極の同定、すなわち、検出、型、および表現について記述する。
オンライン偏光は、しばしばヘイトスピーチ、攻撃的談話、社会的断片化が続くため、懸念を呈している。
したがって、エスカレートする前の検出は、より安全で包括的なオンライン空間にとって不可欠である。
我々は,このSemEvalタスクに対して,QLoRAパラメータ効率の高い微調整手法を用いて,配列分類タスクのための中規模のLLMを微調整した。
トレーニングデータは、匿名化、下ケース化、上ケース化、ホモグリフィドによるマルチリンガル(22言語)トレーニングセットを拡張し、検出をより堅牢にする。
関連論文リスト
- BITS Pilani at SemEval-2026 Task 9: Structured Supervised Fine-Tuning with DPO Refinement for Polarization Detection [2.2588605422113606]
ソーシャルメディアのテキストに政治的偏極を検出するための2段階のアプローチを提案する。
解釈可能なスロットフィリングテンプレートを用いてQwen 2.5-7B-インストラクションをLoRAで微調整する。
SemEval 2026 POLAR共有タスクデータセットの実験では、嗜好ベースの改善は両方の精度を改善し、付加的なアノテーションなしで偽陰性を減少させる。
論文 参考訳(メタデータ) (2026-04-13T07:35:17Z) - Learning the Topic, Not the Language: How LLMs Classify Online Immigration Discourse Across Languages [0.0]
大規模言語モデル(LLM)は、スケーラブルで正確な分析を可能にすることによって、社会科学の研究を変革している。
我々は、移民関連ツイートを分類するために、モノリンガル、バイリンガル、マルチリンガルデータセット上の軽量LLaMA 3.2-3Bモデルを微調整する。
最小限の言語固有の微調整が言語間話題の検出を可能にするか、ターゲット言語を追加することで事前学習バイアスが修正されるかを評価する。
論文 参考訳(メタデータ) (2025-08-08T16:23:24Z) - CEA-LIST at CheckThat! 2025: Evaluating LLMs as Detectors of Bias and Opinion in Text [3.9845507207125967]
本稿では,大言語モデル (LLM) を用いた多言語主観性検出の競争的アプローチを提案する。
LLMは、慎重に設計されたプロンプトと組み合わせることで、微調整されたより小さな言語モデル(SLM)に適合または優れることを示す。
このシステムは,2025年の主観性検出タスクにおいて,複数の言語で上位にランクインした。
論文 参考訳(メタデータ) (2025-07-10T08:35:05Z) - Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study [59.30098850050971]
この研究は、8つの非英語言語にわたるLLMのプロンプトに基づく検出を評価する。
実世界の評価セットのほとんどにおいて、ゼロショットと少数ショットが微調整エンコーダモデルに遅れを生じさせる一方で、ヘイトスピーチ検出のための関数的テストのより優れた一般化を実現していることを示す。
論文 参考訳(メタデータ) (2025-05-09T16:00:01Z) - MrGuard: A Multilingual Reasoning Guardrail for Universal LLM Safety [56.77103365251923]
大規模言語モデル(LLM)は、ジェイルブレイクのような敵の攻撃を受けやすい。
この脆弱性は、多言語セーフティアライメントされたデータが制限される多言語設定で悪化する。
素早い分類のための多言語ガードレールを提案する。
論文 参考訳(メタデータ) (2025-04-21T17:15:06Z) - How do Large Language Models Handle Multilingualism? [81.15060972112563]
本研究では,大規模言語モデル(LLM)が多言語モデルをどのように扱うかを検討する。
LLMはまずクエリを理解し、タスク解決のために多言語入力を英語に変換する。
中間層では、英語を思考に用い、自己意識とフィードフォワード構造を持つ多言語知識を取り入れている。
論文 参考訳(メタデータ) (2024-02-29T02:55:26Z) - KInIT at SemEval-2024 Task 8: Fine-tuned LLMs for Multilingual Machine-Generated Text Detection [0.0]
SemEval-2024 Task 8は、マルチジェネレータ、マルチドメイン、マルチランガルブラックボックスマシン生成テキスト検出に重点を置いている。
提案手法は,第4位にランクインし,勝者のわずか1ポイント未満の競争結果を得た。
論文 参考訳(メタデータ) (2024-02-21T10:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。