論文の概要: Understanding LLM Behavior in Multi-Target Cross-Lingual Summarization
- arxiv url: http://arxiv.org/abs/2606.01252v1
- Date: Sun, 31 May 2026 14:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.476257
- Title: Understanding LLM Behavior in Multi-Target Cross-Lingual Summarization
- Title(参考訳): 多目的言語間相互要約におけるLLMの挙動の理解
- Authors: Sangwon Ryu, Yihong Liu, Mingyang Wang, Yunsu Kim, Jungseul Ok, Gary Geunbae Lee, Hinrich Schuetze,
- Abstract要約: MTXLS (Multi-target cross-lingual text summarization) は、ソース文書を複数のターゲット言語に要約する。
24言語を対象とするMTXLSベンチマークであるMEA(Multi-target cross-lingual element-aware)を導入する。
MTXLSの性能は英語の単言語要約よりもかなり遅れていることを示す。
- 参考スコア(独自算出の注目度): 38.830551891856125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-target cross-lingual text summarization (MTXLS), which summarizes a source document into multiple target languages, is increasingly important as users consume content in diverse languages, but remains underexplored. To address this gap, we introduce multi-target cross-lingual element-aware (MEA), a new MTXLS benchmark covering 24 target languages. We benchmark end-to-end and pipeline approaches across various LLMs and show that MTXLS performance still substantially lags behind English monolingual summarization. To better understand MTXLS in LLMs, we propose a layer-wise analysis framework for investigating how LLMs internally perform MTXLS. Our analyses suggest that translation and summarization behaviors emerge jointly within later layers rather than as distinctly decomposed stages. Most task-relevant processing occurs within these layers, and errors also tend to arise at similar depths. Motivated by these findings, we introduce an inference-time activation steering method that leverages hidden representations from English summarization to guide MTXLS generation. Experiments show that our method consistently improves MTXLS quality across target languages.
- Abstract(参考訳): ソース文書を複数のターゲット言語に要約するMTXLS (Multi-target cross-lingual text summarization) は,ユーザが多言語でコンテンツを消費するにつれて重要度が高くなっているが,まだ未検討である。
このギャップに対処するため、24言語を対象にしたMTXLSベンチマークであるMEA(Multi-target cross-lingual element-aware)を導入する。
我々は、様々なLLMのエンドツーエンドとパイプラインのアプローチをベンチマークし、MTXLSの性能が英語の単言語要約よりもかなり遅れていることを示す。
LLMにおけるMTXLSの理解を深めるために,LLMがMTXLSを内部的にどのように動作させるかを研究するための階層解析フレームワークを提案する。
本分析は,翻訳と要約の挙動が,明らかに分解された段階ではなく,後層内で共同的に現れることを示唆している。
ほとんどのタスク関連処理はこれらのレイヤ内で発生し、エラーも同じような深さで発生する傾向がある。
そこで本研究では,英語の要約から隠れ表現を利用してMTXLS生成を誘導する推論時アクティベーションステアリング手法を提案する。
実験の結果,提案手法は対象言語間のMTXLS品質を継続的に改善することがわかった。
関連論文リスト
- Multilingual Routing in Mixture-of-Experts [45.90403983668531]
並列多言語データセットを用いて、専門家のルーティングパターンを分析する。
MoEモデルは、初期および後期のデコーダ層において、言語固有の方法でトークンをルーティングする。
本稿では,英語で頻繁に活性化される中層タスクエキスパートの促進により,ルータを操る手法を提案する。
論文 参考訳(メタデータ) (2025-10-06T11:09:20Z) - Exploring the Implicit Semantic Ability of Multimodal Large Language Models: A Pilot Study on Entity Set Expansion [26.47488223403437]
マルチモーダル大言語モデル(MLLM)を用いて,エンティティレベルの粒度の暗黙的な意味情報を理解する。
ローカルスコアをグローバルランキングにマッピングするリストワイズランキング手法であるLUSARを導入する。
我々のLUSARは、MESEタスクにおけるMLLMの性能を大幅に向上させ、ESEタスクに生成MLLMを初めて使用し、リストワイドランキングの適用性を高めた。
論文 参考訳(メタデータ) (2024-12-31T08:03:48Z) - Think Carefully and Check Again! Meta-Generation Unlocking LLMs for Low-Resource Cross-Lingual Summarization [108.6908427615402]
CLS(Cross-lingual summarization)は、異なるターゲット言語でソーステキストの要約を生成することを目的としている。
現在、インストラクションチューニング付き大規模言語モデル (LLM) は様々な英語タスクで優れている。
近年の研究では、LCSタスクにおけるLCMの性能は、わずかな設定でも満足できないことが示されている。
論文 参考訳(メタデータ) (2024-10-26T00:39:44Z) - Adapting Large Language Models for Document-Level Machine Translation [46.370862171452444]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。
本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文 参考訳(メタデータ) (2024-01-12T09:29:13Z) - Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis [103.89753784762445]
大規模言語モデル(LLM)は多言語機械翻訳(MMT)の処理において顕著な可能性を示した。
本稿では, MMT における LLM の利点と課題を体系的に検討する。
また,ChatGPTとGPT-4を含む8つのLLMを徹底的に評価した。
論文 参考訳(メタデータ) (2023-04-10T15:51:30Z) - A Primer on Pretrained Multilingual Language Models [18.943173499882885]
MLLM(Multilingual Language Models)は、多数の言語に事前学習の能力をもたらすための実行可能な選択肢として登場した。
本報告では,MLLMに関する研究分野について概説する。
論文 参考訳(メタデータ) (2021-07-01T18:01:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。