論文の概要: When in Doubt, Deliberate: Confidence-Based Routing to Expert Debate for Sexism Detection
- arxiv url: http://arxiv.org/abs/2512.23732v1
- Date: Sun, 21 Dec 2025 05:48:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-04 08:45:17.127277
- Title: When in Doubt, Deliberate: Confidence-Based Routing to Expert Debate for Sexism Detection
- Title(参考訳): 疑わしい時、議論: 信頼に基づくセクシュアリズム検出のための専門家討論へのルーティング
- Authors: Anwar Alajmi, Gabriele Pergola,
- Abstract要約: 我々は,(i)低表現,(ii)雑音,(iii)データおよびモデル予測における概念的あいまいさの複合効果に対処する枠組みを提案する。
提案手法では,タスク EXIST 2025 タスク 1.1 では F1 が +2.72% 改善され,EDOS A と B では +4.48% と +1.30% が得られた。
- 参考スコア(独自算出の注目度): 7.299050989302629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sexist content online increasingly appears in subtle, context-dependent forms that evade traditional detection methods. Its interpretation often depends on overlapping linguistic, psychological, legal, and cultural dimensions, which produce mixed and sometimes contradictory signals, even in annotated datasets. These inconsistencies, combined with label scarcity and class imbalance, result in unstable decision boundaries and cause fine-tuned models to overlook subtler, underrepresented forms of harm. Together, these limitations point to the need for a design that explicitly addresses the combined effects of (i) underrepresentation, (ii) noise, and (iii) conceptual ambiguity in both data and model predictions. To address these challenges, we propose a two-stage framework that unifies (i) targeted training procedures to adapt supervision to scarce and noisy data with (ii) selective, reasoning-based inference to handle ambiguous or borderline cases. Our training setup applies class-balanced focal loss, class-aware batching, and post-hoc threshold calibration to mitigate label imbalance and noisy supervision. At inference time, a dynamic routing mechanism classifies high-confidence cases directly and escalates uncertain instances to a novel \textit{Collaborative Expert Judgment} (CEJ) module, which prompts multiple personas and consolidates their reasoning through a judge model. Our approach achieves state-of-the-art results across several benchmarks, with a +2.72\% improvement in F1 on the EXIST 2025 Task 1.1, and a gains of +4.48\% and +1.30\% on the EDOS Tasks A and B, respectively.
- Abstract(参考訳): オンライン上での性的なコンテンツは、従来の検出方法を回避する微妙で文脈に依存した形でますます現れている。
その解釈は、しばしば重複する言語的、心理的、法的、文化的次元に依存し、注釈付きデータセットでさえ混在し、時には矛盾する信号を生成する。
これらの矛盾とラベル不足とクラス不均衡が組み合わさって不安定な決定境界となり、微調整されたモデルがより微妙で表現不足な害の形式を見落としてしまう。
これらの制限は、組み合わせた効果に明示的に対処する設計の必要性を示している。
(i)控えめな表現
(二)騒音、及び
(3)データとモデル予測の両面における概念的曖昧さ。
これらの課題に対処するために,我々は2段階のフレームワークを提案する。
一 希少で騒々しいデータに監督を適応させるための訓練方法
(ii)曖昧または境界的なケースを扱うための選択的推論に基づく推論。
トレーニング・セットアップでは、ラベルの不均衡とノイズ管理を緩和するために、クラスバランスの焦点損失、クラス意識のバッチ化、および保温後のしきい値校正を適用した。
推論時に、動的ルーティング機構は、信頼度の高いケースを直接分類し、不確実なインスタンスを新しい \textit{Collaborative Expert Judgment} (CEJ) モジュールにエスカレートする。
提案手法では,EXIST 2025 Task 1.1ではF1が+2.72\%,EDOS Tasks AとBでは+4.48\%,+1.30\%向上した。
関連論文リスト
- Learning from Similarity-Confidence and Confidence-Difference [0.07646713951724009]
複数の視点から補完的な弱監督信号を利用する新しい弱監視学習(WSL)フレームワークを提案する。
具体的には,2種類の弱いラベルを統合する手法であるSconfConfDiff Classificationを紹介する。
両推定器が推定誤差境界に対して最適収束率を達成することを証明した。
論文 参考訳(メタデータ) (2025-08-07T07:42:59Z) - Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification [24.24793934981947]
擬似ラベルノイズ(PLN)を考慮した新しい学習パラダイムを提案する。
PLNはノイズオーバーフィット、エラー蓄積、ノイズの多いクラスタ対応の3つの主要な課題によって特徴づけられる。
UVI-ReIDのためのロバスト・デュナリティ学習フレームワーク(RoDE)を提案する。
論文 参考訳(メタデータ) (2025-05-05T10:36:52Z) - Towards Distribution-Agnostic Generalized Category Discovery [51.52673017664908]
データ不均衡とオープンエンドの分布は、現実の視覚世界の本質的な特性である。
我々は,BaCon(Self-Balanced Co-Advice contrastive framework)を提案する。
BaConは、対照的な学習ブランチと擬似ラベルブランチで構成され、DA-GCDタスクを解決するためのインタラクティブな監視を提供するために協力して動作する。
論文 参考訳(メタデータ) (2023-10-02T17:39:58Z) - Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。
また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。
様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文 参考訳(メタデータ) (2023-02-22T14:50:24Z) - Uncertain Facial Expression Recognition via Multi-task Assisted
Correction [43.02119884581332]
MTACと呼ばれる不確実な表情認識に対処するためのマルチタスク支援補正法を提案する。
具体的には、信頼度推定ブロックと重み付け正則化モジュールを用いて、固体試料をハイライトし、バッチ毎に不確かさサンプルを抑圧する。
RAF-DB、AffectNet、AffWild2データセットの実験は、MTACが合成および実際の不確実性に直面した際のベースラインよりも大幅に改善されていることを示した。
論文 参考訳(メタデータ) (2022-12-14T10:28:08Z) - Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。