Fugu-MT 論文翻訳(概要): Teaching Large Language Models Number-Focused Headline Generation With Key Element Rationales

論文の概要: Teaching Large Language Models Number-Focused Headline Generation With Key Element Rationales

arxiv url: http://arxiv.org/abs/2502.03129v1
Date: Wed, 05 Feb 2025 12:39:07 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-06 16:28:51.08545
Title: Teaching Large Language Models Number-Focused Headline Generation With Key Element Rationales
Title（参考訳）: キー要素の合理化による大規模言語モデルにおける数焦点見出し生成の指導
Authors: Zhen Qian, Xiuzhen Zhang, Xiaofei Xu, Feng Xia,
Abstract要約: 数中心の見出し生成は、Large Language Models (LLMs) のユニークな挑戦である本稿では,ニュース記事におけるトピック,エンティティ,数値推論(TEN)のキー要素を構成する有理性を利用するための新しいチェーン・オブ・シント・フレームワークを提案する。提案手法は,数値推論能力とトピック整合型数値見出し生成能力の強化により,学生のLLM自動生成を指導するものである。
参考スコア（独自算出の注目度）: 11.428237505896218
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Number-focused headline generation is a summarization task requiring both high textual quality and precise numerical accuracy, which poses a unique challenge for Large Language Models (LLMs). Existing studies in the literature focus only on either textual quality or numerical reasoning and thus are inadequate to address this challenge. In this paper, we propose a novel chain-of-thought framework for using rationales comprising key elements of the Topic, Entities, and Numerical reasoning (TEN) in news articles to enhance the capability for LLMs to generate topic-aligned high-quality texts with precise numerical accuracy. Specifically, a teacher LLM is employed to generate TEN rationales as supervision data, which are then used to teach and fine-tune a student LLM. Our approach teaches the student LLM automatic generation of rationales with enhanced capability for numerical reasoning and topic-aligned numerical headline generation. Experiments show that our approach achieves superior performance in both textual quality and numerical accuracy.
Abstract（参考訳）: 数字中心の見出し生成は、高いテキスト品質と正確な数値精度の両方を必要とする要約タスクであり、Large Language Models (LLMs) に固有の課題をもたらす。文献における既存の研究は、文章の品質と数値的推論にのみ焦点をあてており、この課題に対処するには不十分である。本稿では, トピック, エンティティ, 数値推論(TEN)のキー要素からなる有理数を用いた, トピック対応の高品質テキストを高精度に生成する能力を高めるための, 新たな思考の連鎖フレームワークを提案する。具体的には、教師 LLM を用いて TEN 論理を教師データとして生成し、学生 LLM を指導・微調整する。提案手法は,数値推論能力とトピック整合型数値見出し生成能力の強化により,学生のLLM自動生成を指導するものである。実験により,本手法はテキストの品質と数値的精度の両方において優れた性能を発揮することが示された。

関連論文リスト

Tracing Thought: Using Chain-of-Thought Reasoning to Identify the LLM Behind AI-Generated Text [1.7034813545878589]
COT Fine-tunedはAI生成テキストを検出するための新しいフレームワークである。提案手法の主な革新は,チェーン・オブ・ソート推論の利用である。実験の結果、COTは両方のタスクで高精度に調整された。
論文参考訳（メタデータ） (2025-04-23T17:39:49Z)
Guiding LLMs to Generate High-Fidelity and High-Quality Counterfactual Explanations for Text Classification [2.899704155417792]
大規模言語モデルによる対実生成を支援するための単純な分類器誘導方式を2つ導入する。その単純さにもかかわらず、我々の手法は最先端の対物生成方法より優れている。
論文参考訳（メタデータ） (2025-03-06T14:15:07Z)
Integrating Planning into Single-Turn Long-Form Text Generation [66.08871753377055]
長文コンテンツを生成するための計画案を提案する。私たちの主な新規性は、複数のプロンプトや計画のラウンドを必要としない単一の補助的なタスクにあります。実験では,LLMを補助タスクで微調整し,高品質な文書を生成する,異なる領域からの2つのデータセットを実証した。
論文参考訳（メタデータ） (2024-10-08T17:02:40Z)
Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization [0.27624021966289597]
本稿では,Large Language Models (LLM) を利用した抽出要約フレームワークであるEYEGLAXSを紹介する。 EYEGLAXSは、事実的および文法的整合性を保証するために抽出的な要約に焦点を当てている。このシステムはPubMedやArXivといった有名なデータセットに新しいパフォーマンスベンチマークを設定する。
論文参考訳（メタデータ） (2024-08-28T13:52:19Z)
Systematic Task Exploration with LLMs: A Study in Citation Text Generation [63.50597360948099]
大規模言語モデル(LLM)は、複雑な創造的自然言語生成(NLG)タスクの定義と実行において、前例のない柔軟性をもたらす。本稿では,系統的な入力操作,参照データ,出力測定からなる3成分研究フレームワークを提案する。我々はこのフレームワークを用いて引用テキスト生成を探索する。これは一般的なNLPタスクであり、タスク定義と評価基準に関するコンセンサスを欠いている。
論文参考訳（メタデータ） (2024-07-04T16:41:08Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
Exploration of Masked and Causal Language Modelling for Text Generation [6.26998839917804]
本稿では,テキスト生成タスクにおける因果言語モデリング手法の広範な比較を行う。まず、定量的な指標を用いて、コヒーレンスと文法的正当性を分析する定性的な人的評価を行う。その結果、すべてのデータセットでテキスト生成において、CLMは一貫して上回っていることがわかった。
論文参考訳（メタデータ） (2024-05-21T09:33:31Z)
Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文参考訳（メタデータ） (2024-02-16T13:53:26Z)
CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。 LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文参考訳（メタデータ） (2023-11-29T08:29:54Z)
Exploring the Potential of Large Language Models in Computational Argumentation [54.85665903448207]
大規模言語モデル (LLM) は、文脈を理解し、自然言語を生成するという印象的な能力を実証している。この研究は、ChatGPT、Flanモデル、LLaMA2モデルなどのLLMをゼロショットと少数ショットの両方で評価することを目的としている。
論文参考訳（メタデータ） (2023-11-15T15:12:15Z)
Successor Features for Efficient Multisubject Controlled Text Generation [48.37713738712319]
本稿では,後継機能 (SF) と言語モデル修正の2つの基本概念を基礎とするSF-GENを紹介する。 SF-GENはこの2つをシームレスに統合し、LCMのパラメータを変更することなくテキスト生成の動的ステアリングを可能にする。我々の知る限り、本研究はテキスト生成における後継機能の最初の応用である。
論文参考訳（メタデータ） (2023-11-03T00:17:08Z)
Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.86436777626959]
大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文参考訳（メタデータ） (2023-07-29T14:11:15Z)
Prompting Large Language Models for Counterfactual Generation: An Empirical Study [13.506528217009507]
大規模言語モデル(LLM)は、幅広い自然言語理解と生成タスクにおいて顕著な進歩を遂げている。本稿では,様々な種類のNLUタスクに対する総合的な評価フレームワークを提案する。
論文参考訳（メタデータ） (2023-05-24T06:44:32Z)
Language Model Self-improvement by Reinforcement Learning Contemplation [13.152789365858812]
本稿では,LanguageModel Self-Improvement by Reinforcement Learning Contemplation (SIRLC) という,教師なしの新しい手法を提案する。学生として、モデルはラベルのない質問に対する回答を生成し、教師として、生成されたテキストを評価し、それに応じてスコアを割り当てる。我々は,SIRLCを推論問題,テキスト生成,機械翻訳など,様々なNLPタスクに適用できることを実証した。
論文参考訳（メタデータ） (2023-05-23T19:25:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。