論文の概要: QFS-Composer: Query-focused summarization pipeline for less resourced languages
- arxiv url: http://arxiv.org/abs/2604.10687v1
- Date: Sun, 12 Apr 2026 15:25:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.172001
- Title: QFS-Composer: Query-focused summarization pipeline for less resourced languages
- Title(参考訳): QFS-Composer: リソースの少ない言語のためのクエリ中心の要約パイプライン
- Authors: Vuk Đuranović, Marko Robnik Šikonja,
- Abstract要約: 大規模言語モデル(LLM)はテキスト要約において高い性能を示すが、その効果は訓練リソースが制限された言語間で著しく低下する。
この研究は、ラベル付きデータセットと評価ツールが限定されている低リソース言語におけるクエリ中心の要約(QFS)の課題に対処する。
本稿では、クエリ分解、質問生成(QG)、質問応答(QA)、抽象的な要約を統合し、要約とユーザ意図の現実的アライメントを改善する新しいQFSフレームワーク、QFS-Composerを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) demonstrate strong performance in text summarization, yet their effectiveness drops significantly across languages with restricted training resources. This work addresses the challenge of query-focused summarization (QFS) in less-resourced languages, where labeled datasets and evaluation tools are limited. We present a novel QFS framework, QFS-Composer, that integrates query decomposition, question generation (QG), question answering (QA), and abstractive summarization to improve the factual alignment of a summary with user intent. We test our approach on the Slovenian language. To enable high-quality supervision and evaluation, we develop the Slovenian QA and QG models based on a Slovene LLM and adapt evaluation approaches for reference-free summary evaluation. Empirical evaluation shows that the QA-guided summarization pipeline yields improved consistency and relevance over baseline LLMs. Our work establishes an extensible methodology for advancing QFS in less-resourced languages.
- Abstract(参考訳): 大規模言語モデル(LLM)はテキスト要約において高い性能を示すが、その効果は訓練リソースが制限された言語間で著しく低下する。
この研究は、ラベル付きデータセットと評価ツールが限定されている低リソース言語におけるクエリ中心の要約(QFS)の課題に対処する。
本稿では、クエリ分解、質問生成(QG)、質問応答(QA)、抽象的な要約を統合し、要約とユーザ意図の現実的アライメントを改善する新しいQFSフレームワーク、QFS-Composerを提案する。
我々はスロベニア語で我々のアプローチをテストする。
高品質な監視と評価を実現するため,スロベニアのLLMに基づくQAモデルとQGモデルを開発し,基準のない要約評価に適応する手法を提案する。
実験により,QA誘導の要約パイプラインはベースラインLLMよりも一貫性と妥当性を向上することが示された。
我々の研究は、低リソース言語でQFSを進めるための拡張可能な方法論を確立している。
関連論文リスト
- JobResQA: A Benchmark for LLM Machine Reading Comprehension on Multilingual Résumés and JDs [3.83467384247581]
JobResQAは、HR固有のタスクで機械読み取り(MRC)機能を評価するためのベンチマークである。
データセットは、5つの言語で105のresumé-job記述ペアに対して511のQAペアで構成されている。
論文 参考訳(メタデータ) (2026-01-30T17:06:59Z) - When LLMs Struggle: Reference-less Translation Evaluation for Low-resource Languages [9.138590152838754]
セグメントレベルの品質評価(QE)は言語間理解の難しい課題である。
ゼロ/フェーショットシナリオにおいて,大規模言語モデル (LLM) を包括的に評価する。
この結果から,エンコーダを用いた微調整QEモデルでは,プロンプトベースアプローチの方が優れていたことが示唆された。
論文 参考訳(メタデータ) (2025-01-08T12:54:05Z) - IDEAL: Leveraging Infinite and Dynamic Characterizations of Large Language Models for Query-focused Summarization [59.06663981902496]
クエリ中心の要約(QFS)は、特定の関心事に答え、より優れたユーザ制御とパーソナライゼーションを可能にする要約を作成することを目的としている。
本稿では,LLMを用いたQFSモデル,Longthy Document Summarization,およびクエリ-LLMアライメントの2つの重要な特徴について検討する。
これらのイノベーションは、QFS技術分野における幅広い応用とアクセシビリティの道を開いた。
論文 参考訳(メタデータ) (2024-07-15T07:14:56Z) - Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z) - From Multiple-Choice to Extractive QA: A Case Study for English and Arabic [51.13706104333848]
既存の多言語データセットを新しいNLPタスクに再利用する可能性について検討する。
本稿では,英語および現代標準アラビア語に対するアノテーションガイドラインと並列EQAデータセットを提案する。
我々は、残りの120のBELEBELE言語変種に対して、他の人が我々のアプローチを適用するのを助けることを目指しており、その多くがリソース不足と見なされている。
論文 参考訳(メタデータ) (2024-04-26T11:46:05Z) - QontSum: On Contrasting Salient Content for Query-focused Summarization [22.738731393540633]
クエリ中心の要約(QFS)は、特定のクエリに対処する要約を生成する自然言語処理において難しいタスクである。
本稿では,GARにおけるQFSの役割について述べる。
コントラスト学習を利用したQFSの新しい手法であるQontSumを提案する。
論文 参考訳(メタデータ) (2023-07-14T19:25:35Z) - LMGQS: A Large-scale Dataset for Query-focused Summarization [77.6179359525065]
我々は4つの一般的な要約ベンチマークを新しいQFSベンチマークデータセットであるLMGQSに変換する。
我々は最先端の要約モデルを用いてベースラインを確立する。
複数の既存のQFSベンチマークにおいて、最先端のゼロショットと教師付きパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-05-22T14:53:45Z) - PAXQA: Generating Cross-lingual Question Answering Examples at Training
Scale [53.92008514395125]
PAXQA(クロスリンガル(x)QAのアノテーションの計画)は、クロスリンガルQAを2段階に分解する。
本稿では、並列ビットから制約されたエンティティを抽出する語彙制約機械翻訳の新たな利用法を提案する。
これらのデータセットに基づいて微調整されたモデルは、複数の抽出されたQAデータセット上で、先行合成データ生成モデルより優れていることを示す。
論文 参考訳(メタデータ) (2023-04-24T15:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。