論文の概要: NCL-BU at SemEval-2026 Task 3: Fine-tuning XLM-RoBERTa for Multilingual Dimensional Sentiment Regression
- arxiv url: http://arxiv.org/abs/2604.08923v1
- Date: Fri, 10 Apr 2026 03:38:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.669862
- Title: NCL-BU at SemEval-2026 Task 3: Fine-tuning XLM-RoBERTa for Multilingual Dimensional Sentiment Regression
- Title(参考訳): SemEval-2026 Task 3: Fine-tuning XLM-RoBERTa for Multilingual dimensional Sentiment Regression
- Authors: Tong Wu, Nicolay Rusnachenko, Huizhi Liang,
- Abstract要約: 本稿では,トラックA-サブタスク1(次元アスペクト知覚回帰)のために開発されたシステムについて述べる。
テキスト中の各アスペクトの[1, 9]範囲で、実値のVAスコアを予測することを目的としている。
- 参考スコア(独自算出の注目度): 5.8096845806519335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dimensional Aspect-Based Sentiment Analysis (DimABSA) extends traditional ABSA from categorical polarity labels to continuous valence-arousal (VA) regression. This paper describes a system developed for Track A - Subtask 1 (Dimensional Aspect Sentiment Regression), aiming to predict real-valued VA scores in the [1, 9] range for each given aspect in a text. A fine-tuning approach based on XLM-RoBERTa-base is adopted, constructing the input as [CLS] T [SEP] a_i [SEP] and training dual regression heads with sigmoid-scaled outputs for valence and arousal prediction. Separate models are trained for each language-domain combination (English and Chinese across restaurant, laptop, and finance domains), and training and development sets are merged for final test predictions. In development experiments, the fine-tuning approach is compared against several large language models including GPT-5.2, LLaMA-3-70B, LLaMA-3.3-70B, and LLaMA-4-Maverick under a few-shot prompting setting, demonstrating that task-specific fine-tuning substantially and consistently outperforms these LLM-based methods across all evaluation datasets. The code is publicly available at https://github.com/tongwu17/SemEval-2026-Task3-Track-A.
- Abstract(参考訳): 次元アスペクトベース知覚分析(DimABSA)は、カテゴリー極性ラベルから連続原子価覚醒(VA)回帰まで、従来のABSAを拡張している。
本稿では,テキスト中の各アスペクトの[1, 9]範囲における実測値VAスコアの予測を目的とした,トラックA-サブタスク1(次元アスペクト知覚回帰)のためのシステムについて述べる。
入力を[CLS]T[SEP]a_i[SEP]として構成し,シグモイドスケールの出力で2重回帰ヘッドをトレーニングし,精度と覚醒予測を行う,XLM-RoBERTaベースに基づく微調整手法を採用した。
各言語ドメインの組み合わせ(レストラン、ラップトップ、金融ドメインにわたる英語と中国語)ごとに個別のモデルが訓練され、最終的なテスト予測のためにトレーニングと開発セットがマージされる。
開発実験では、GPT-5.2、LLaMA-3-70B、LLaMA-3.3-70B、LLaMA-4-Maverickなどの大規模言語モデルと比較し、タスク固有の微調整が全ての評価データセットでこれらのLCMベースの手法を大幅に上回ることを示した。
コードはhttps://github.com/tongwu17/SemEval-2026-Task3-Track-Aで公開されている。
関連論文リスト
- Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models [102.20309135516186]
クロスエントロピー(CE)トレーニングは、言語モデルの密集したスケーラブルな監視を提供する。
言語モデル微調整のための特徴マッチング手法を提案する。
この目的を効率的に最適化するために,エネルギーベースファインチューニングを提案する。
論文 参考訳(メタデータ) (2026-03-12T17:57:50Z) - QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis [3.1948816877289268]
本稿では,SemEval-2026タスク3の次元的側面に基づく感情回帰に関するシステムを提案する。
提案手法は,回帰と離散化を用いた感情予測を併用したハイブリッドRoBERTaエンコーダである。
論文 参考訳(メタデータ) (2026-03-08T18:59:27Z) - AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis [13.528308058170479]
次元アスペクトベース感性分析(DimABSA)に基づくSemEval-2026タスク3のトラックAのためのAILS-NTUAシステムを提案する。
提案手法は,連続的なアスペクトレベルの感情予測のための言語固有バックボーンの微調整と,LoRAを用いた大規模言語モデルの言語固有命令チューニングを併用する。
この統合されたタスク適応型設計は、言語とドメイン間のパラメータ効率の高い特殊化を強調し、強力な有効性を維持しながら、トレーニングと推論の要求を削減できる。
論文 参考訳(メタデータ) (2026-03-05T08:30:59Z) - What Language Models Know But Don't Say: Non-Generative Prior Extraction for Generalization [5.663538370244175]
ベイジアンロジスティック回帰のための情報的事前分布を抽出する決定論的手法であるLoIDを提案する。
生成したテキストに頼るのではなく、注意深く構築された文を通して、モデルが対立する意味的方向に対する自信を探索する。
合成アウトオブディストリビューション(OOD)設定下で10個の実世界のデータセット上でLoIDを評価する。
論文 参考訳(メタデータ) (2026-01-24T22:05:01Z) - Large-Scale Aspect-Based Sentiment Analysis with Reasoning-Infused LLMs [1.4732811715354455]
Arctic-ABSAは、現実のアスペクトベースの感情分析(ABSA)のための強力なモデルの集合体である
当社のモデルは,大規模な公開データコーパスと慎重に生成された合成データに基づいてトレーニングされた商用ニーズに合わせて調整されているため,SemEval14の20倍のデータセットが生成される。
単一の多言語モデルは、英語のパフォーマンスを低下させることなく、6つの言語で87-91%の精度を維持している。
論文 参考訳(メタデータ) (2026-01-07T13:58:29Z) - Quantile Regression with Large Language Models for Price Prediction [15.277244542405345]
大規模言語モデル(LLM)は、回帰を含む構造化予測タスクにおいて有望であることを示している。
我々は,LLMが完全な予測分布を生成できる新しい量子レグレッション手法を提案する。
量子ヘッドを微調整したMistral-7Bモデルは、点推定と分布推定の両方において従来の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2025-06-07T04:19:28Z) - Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training [68.94373533768501]
我々は、知識保持をモデル化し、そのコーパスから事実情報を記憶するための事前学習言語モデルの能力を示し、学習前にそれを推定する原則的手法を導入する。
本稿では,知識周波数,知識特異度,モデルサイズを統合し,クローズドブック質問応答(QA)の精度を予測する情報理論予測器である,サイズ依存型相互情報(SMI)を提案する。
論文 参考訳(メタデータ) (2025-02-06T13:23:53Z) - SEED-Bench-2: Benchmarking Multimodal Large Language Models [67.28089415198338]
MLLM(Multimodal large language model)は、最近、テキストだけでなく、インターリーブされたマルチモーダル入力の画像を生成できることを実証した。
SEED-Bench-2は、正確な人間のアノテーションを持つ24Kの多重選択質問で構成されており、27次元にまたがっている。
我々は,23個の著名なオープンソースMLLMの性能を評価し,貴重な観察結果を要約した。
論文 参考訳(メタデータ) (2023-11-28T05:53:55Z) - The Languini Kitchen: Enabling Language Modelling Research at Different
Scales of Compute [66.84421705029624]
本稿では,アクセル時間で測定された等価計算に基づくモデル比較を可能にする実験的プロトコルを提案する。
私たちは、既存の学術的ベンチマークを上回り、品質、多様性、文書の長さで上回る、大規模で多様で高品質な書籍データセットを前処理します。
この研究は、GPT-2アーキテクチャから派生したフィードフォワードモデルと、10倍のスループットを持つ新しいLSTMの形式でのリカレントモデルという2つのベースラインモデルも提供する。
論文 参考訳(メタデータ) (2023-09-20T10:31:17Z) - A Generative Language Model for Few-shot Aspect-Based Sentiment Analysis [90.24921443175514]
我々は、アスペクト項、カテゴリを抽出し、対応する極性を予測するアスペクトベースの感情分析に焦点を当てる。
本稿では,一方向の注意を伴う生成言語モデルを用いて,抽出タスクと予測タスクをシーケンス生成タスクに再構成することを提案する。
提案手法は,従来の最先端(BERTをベースとした)の性能を,数ショットとフルショットの設定において,大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-04-11T18:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。