論文の概要: Zero-Shot to Full-Resource: Cross-lingual Transfer Strategies for Aspect-Based Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2604.26619v1
- Date: Wed, 29 Apr 2026 12:45:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.398987
- Title: Zero-Shot to Full-Resource: Cross-lingual Transfer Strategies for Aspect-Based Sentiment Analysis
- Title(参考訳): Zero-Shot to Full-Resource:Aspect-Based Sentiment Analysisのための言語間移動方式
- Authors: Jakob Fehle, Nils Constantin Hellwig, Udo Kruschwitz, Christian Wolff,
- Abstract要約: Aspect-based Sentiment Analysis (ABSA)はテキスト内の特定の側面に対するきめ細かい意見を抽出する。
本研究では、7言語にわたる最先端ABSAアプローチの多言語評価を行う。
- 参考スコア(独自算出の注目度): 5.745953883559217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect-based Sentiment Analysis (ABSA) extracts fine-grained opinions toward specific aspects within text but remains largely English-focused despite major advances in transformer-based and instruction-tuned models. This work presents a multilingual evaluation of state-of-the-art ABSA approaches across seven languages (English, German, French, Dutch, Russian, Spanish, and Czech) and four subtasks (ACD, ACSA, TASD, ASQP). We systematically compare different transformer architectures under zero-resource, data-only, and full-resource settings, using cross-lingual transfer, code-switching and machine translation. Fine-tuned Large Language Models (LLMs) achieve the highest overall scores, particularly in complex generative tasks, while few-shot counterparts approach this performance in simpler setups, where smaller encoder models also remain competitive. Cross-lingual training on multiple non-target languages yields the strongest transfer for fine-tuned LLMs, while smaller encoder or seq-to-seq models benefit most from code-switching, highlighting architecture-specific strategies for multilingual ABSA. We further contribute two new German datasets, an adapted GERestaurant and the first German ASQP dataset (GERest), to encourage multilingual ABSA research beyond English.
- Abstract(参考訳): Aspect-based Sentiment Analysis (ABSA)は、テキスト内の特定の側面に対するきめ細かい意見を抽出するが、トランスフォーマーベースのモデルとインストラクションチューニングモデルの大きな進歩にもかかわらず、主に英語に焦点を当てている。
この研究は、7つの言語(英語、ドイツ語、フランス語、オランダ語、ロシア語、スペイン語、チェコ語)と4つのサブタスク(ACD、ACSA、TASD、ASQP)にまたがる最先端のABSAアプローチを多言語で評価する。
我々は、言語間変換、コードスイッチング、機械翻訳を用いて、ゼロリソース、データオンリー、フルリソース設定下で異なるトランスフォーマーアーキテクチャを体系的に比較する。
微調整された大規模言語モデル(LLM)は、特に複雑な生成タスクにおいて、最も高い総合スコアを達成する一方、より単純なセットアップでは、より小さなエンコーダモデルも競争力を維持する。
複数の非ターゲット言語での言語間のトレーニングは、細調整されたLLMに対して最も強力な転送をもたらす一方、より小さなエンコーダやセクツーセックモデルは、多言語ABSAのためのアーキテクチャ固有の戦略を強調したコードスイッチの恩恵を受ける。
さらに、適応されたGERestaurantと最初のドイツ語ASQPデータセット(GERest)の2つの新しいドイツのデータセットをコントリビュートし、英語以外の多言語ABSA研究を促進する。
関連論文リスト
- Extending Czech Aspect-Based Sentiment Analysis with Opinion Terms: Dataset and LLM Benchmarks [1.9779500088459443]
本稿では、アスペクトベース感情分析(ABSA)のためのレストラン領域における新しいチェコのデータセットを紹介する。
我々は、モノリンガル、クロスリンガル、マルチリンガル設定における大規模言語モデル(LLM)を含む、現代のトランスフォーマーモデルを用いた広範な実験を行う。
詳細なエラー分析では、微妙な意見用語の検出やニュアンスされた感情表現など、重要な課題が明らかにされている。
論文 参考訳(メタデータ) (2026-02-26T08:13:42Z) - Improving Language and Modality Transfer in Translation by Character-level Modeling [14.145120349133007]
現在の翻訳システムは多言語であるにもかかわらず、世界の言語のうち5%しかカバーしていない。
新しい言語やモダリティへの適応性を改善するための文字ベースアプローチを提案する。
論文 参考訳(メタデータ) (2025-05-30T13:16:08Z) - LUSIFER: Language Universal Space Integration for Enhanced Multilingual Embeddings with Large Language Models [89.13128402847943]
LUSIFERは,LLMをベースとした多言語タスクの埋め込みモデルに,多言語監視を必要とせずに適用可能なゼロショット方式である。
LUSIFERのアーキテクチャは多言語エンコーダを組み、言語ユニバーサル学習者として機能し、埋め込み固有のタスクに最適化されたLLMベースの埋め込みモデルと組み合わせている。
5つの主要な埋め込みタスク、123の多様なデータセット、14言語にわたるカバレッジを含む新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2025-01-01T15:43:07Z) - QAmeleon: Multilingual QA with Only 5 Examples [71.80611036543633]
数ショットの学習環境下で事前学習した言語モデルを利用する方法を示す。
我々のアプローチであるQAmeleonは、PLMを使用して、QAモデルをトレーニングした多言語データを自動的に生成する。
言語毎に5つの例しか持たないデータ合成のためにPLMをプロンプトチューニングすることで、翻訳ベースのベースラインよりも精度が向上する。
論文 参考訳(メタデータ) (2022-11-15T16:14:39Z) - Multilingual Transfer Learning for QA Using Translation as Data
Augmentation [13.434957024596898]
我々は,多言語組込みを意味空間に近づけることで,言語間伝達を改善する戦略を検討する。
言語敵対的トレーニングと言語仲裁フレームワークという2つの新しい戦略を提案し、(ゼロリソースの)クロスリンガルトランスファーのパフォーマンスを大幅に改善します。
実験により,提案モデルは,最近導入された多言語MLQAデータセットとTyDiQAデータセットにおいて,以前のゼロショットベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-10T20:29:34Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。