SemEval-2026 Task 3: Dimensional Aspect-Based Sentiment Analysis (DimABSA)
Abstractの概要
本論文は、SemEval-2026 Task 3として、次元アスペクトベース感情分析(DimABSA)に関する共有タスクを提示している。従来のABSAにおけるカテゴリカルな極性ラベルを、連続的なバレンス–覚醒度(VA)スコアに置き換えるものである。タスクは2つのトラックで構成される:Track A(DimABSA)はアスペクトレベルの回帰、トリプレット抽出、クアドラプレット抽出のサブタスクを含み、Track B(DimStance)はスタンスのターゲットをアスペクトとして扱い、スタンス検出をVA回帰として再定式化する。ベンチマークは複数言語(Track Aは6言語、Track Bは5言語)および複数ドメインにまたがる。本論文では、データセット構築、アノテーション手順、新規の連続F1(cF1)指標を含む評価指標、ベースライン、および両トラックにわたる42チームからの112件の最終提出結果の分析が詳述されている。
新規性
主要な貢献は、ABSAおよびスタンス検出を離散的な感情・スタンスラベルではなく、連続的なバレンス–覚醒度空間で再定式化した点にある。本研究はスタンスのターゲットをアスペクトとして扱いVA回帰を行うDimStanceを新たなタスク定式化として導入し、構造化抽出と連続的なVA予測を統合的に評価するための連続F1(cF1)指標を提案している。
成果
共有タスクには400名以上の参加者が集まり、2つのトラックにわたって112件の最終提出と42件のシステム記述論文が得られた。中国語および日本語のデータセットではより低いRMSEが達成された一方、タタール語(Track A)やスワヒリ語(Track B)などの低リソース言語では最も高い誤差が観察された。クアドラプレット抽出(DimASQP)はトリプレット抽出(DimASTE)よりも困難であり、ラップトップやホテルなどアスペクトカテゴリセットが大きく不均衡なドメインでは顕著な性能低下が見られた。
論文の注目点
- 本タスクは2つのトラックを定義している:アスペクトレベルの次元感情分析(回帰、トリプレット抽出、クアドラプレット抽出のサブタスクを含む)のためのDimABSAと、スタンスターゲットのVA回帰のためのDimStanceであり、多言語・多ドメインのデータセットによって支えられている。
- 構造化抽出の精度とVA回帰の品質を統合的に評価するため、正規化されたVA距離をF1の定式化に組み込んだ新しい連続F1(cF1)指標が導入されている。
- 上位システムはファインチューニングされた事前学習済みトランスフォーマーやLLMを基盤とし、分布キャリブレーション、敵対的学習、検索ベースのインコンテキスト学習、アンサンブルなどの手法を活用しているが、低リソース言語(タタール語、スワヒリ語)は依然として最も困難な設定となっている。