論文の概要: Automatic Generation of Factual News Headlines in Finnish
- arxiv url: http://arxiv.org/abs/2212.02170v1
- Date: Mon, 5 Dec 2022 11:12:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 16:49:46.774793
- Title: Automatic Generation of Factual News Headlines in Finnish
- Title(参考訳): フィンランドにおける実ニュース見出しの自動生成
- Authors: Maximilian Koppatz, Khalid Alnajjar, Mika H\"am\"al\"ainen, Thierry
Poibeau
- Abstract要約: 我々はこれを,モデルにニュース記事が与えられる要約タスクとしてモデル化し,その課題は記事の主要なトピックを記述した簡潔な見出しを作成することである。
フィンランドでは GPT-2 モデルが公開されていないため、まず複数のコーパスを用いて構築する。
モデルは、巨大なニュースコーパスを使用して、見出し生成タスクのために微調整される。
- 参考スコア(独自算出の注目度): 1.6918354618189375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel approach to generating news headlines in Finnish for a
given news story. We model this as a summarization task where a model is given
a news article, and its task is to produce a concise headline describing the
main topic of the article. Because there are no openly available GPT-2 models
for Finnish, we will first build such a model using several corpora. The model
is then fine-tuned for the headline generation task using a massive news
corpus. The system is evaluated by 3 expert journalists working in a Finnish
media house. The results showcase the usability of the presented approach as a
headline suggestion tool to facilitate the news production process.
- Abstract(参考訳): 我々は、あるニュース記事に対してフィンランド語でニュース見出しを生成するための新しいアプローチを提案する。
我々はこれを,あるモデルにニュース記事が与えられる要約タスクとしてモデル化し,その課題は記事の主要なトピックを記述した簡潔な見出しを作成することである。
フィンランドでは GPT-2 モデルが公開されていないため、まず複数のコーパスを用いて構築する。
モデルは、巨大なニュースコーパスを使用して、見出し生成タスクのために微調整される。
このシステムはフィンランドのメディアハウスで働く3人の専門家ジャーナリストによって評価されている。
提案手法は,ニュース生成プロセスを容易にするための見出し提案ツールとしての有用性を示す。
関連論文リスト
- Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文 参考訳(メタデータ) (2023-05-24T08:56:35Z) - Framing the News:From Human Perception to Large Language Model
Inferences [8.666172545138272]
ニュースのフレームを特定することは、記事のビジョン、意図、伝達すべきメッセージ、ニュースのどの側面が強調されるかを理解するために重要である。
我々は,5カ国のヨーロッパの新聞のノヴァックス運動記事の1786年の見出しに,フレームの人為的ラベル付けのためのプロトコルを開発した。
まず, GPT-3.5 の微調整手法と, GPT-3.5 のプロンプトエンジニアリング手法の2つの手法について検討した。
論文 参考訳(メタデータ) (2023-04-27T18:30:18Z) - Beyond Discrete Genres: Mapping News Items onto a Multidimensional
Framework of Genre Cues [0.0]
ジャンル的手がかりの観点でニュース項目をマッピングするための非離散的フレームワークを提案する。
大量のニュース記事を自動的に分析するために,ニュース文を予測するための2つの計算モデルを提供する。
このアプローチは、ニュースジャンルの進化する性質についての洞察を深めるのに役立ちます。
論文 参考訳(メタデータ) (2022-12-08T10:54:31Z) - NewsEdits: A News Article Revision Dataset and a Document-Level
Reasoning Challenge [122.37011526554403]
NewsEditsは、最初に公開されたニュースリビジョン履歴のデータセットである。
120万記事と、22以上の英語とフランス語の新聞ソースから460万バージョンを収録している。
論文 参考訳(メタデータ) (2022-06-14T18:47:13Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - End-to-End Segmentation-based News Summarization [15.549631631269198]
本稿では,ニュース記事を複数のセクションに分割し,各セクションに対応する要約を生成するタスクを紹介する。
まず、セクションとアライメントスタイルのセクション要約を備えた27Kのニュース記事からなるデータセット、SegNewsを作成し、利用可能にします。
次に,事前学習した言語モデルに適応したセグメンテーションに基づく新しい言語生成モデルを提案する。
論文 参考訳(メタデータ) (2021-10-15T04:17:26Z) - Modeling "Newsworthiness" for Lead-Generation Across Corpora [85.92467549469147]
自動ラベル付きコーパスでモデルをトレーニングして,各記事がフロントページであるかどうかを予測した。
ラベルのないコーポラの文書に「新しさ」をランク付けする
微調整されたRoBERTaモデルは、ホールトアウトラベル付き文書で.93AUC、エキスパート検証未ラベルコーパスで.88AUCを達成する。
論文 参考訳(メタデータ) (2021-04-19T21:48:15Z) - NewsBERT: Distilling Pre-trained Language Model for Intelligent News
Application [56.1830016521422]
本稿では,学習済み言語モデルを抽出し,効率的なニュースインテリジェンスを実現するNewsBERTを提案する。
そこで本研究では,教師と学生の共学モデルを協調的に学習するための,教師と学生の共学学習・蒸留の枠組みを設計する。
実験では,NewsBERTはより小さなモデルで,様々なインテリジェントなニュースアプリケーションのモデル性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2021-02-09T15:41:12Z) - Viable Threat on News Reading: Generating Biased News Using Natural
Language Models [49.90665530780664]
公開されている言語モデルは、入力されたオリジナルニュースに基づいてバイアスのあるニュースコンテンツを確実に生成できることを示す。
また、制御可能なテキスト生成を用いて、多数の高品質な偏りのあるニュース記事を生成することができることを示す。
論文 参考訳(メタデータ) (2020-10-05T16:55:39Z) - Generating Representative Headlines for News Stories [31.67864779497127]
同じ出来事をニュースに報告している記事のグループ化は、読者がニュースを消費するのを助ける一般的な方法である。
各ストーリーの代表的見出しを効率的かつ効果的に生成することは、依然として困難な研究課題である。
我々は,人間のアノテーションを使わずに大規模世代モデルを訓練するための遠隔監視手法を開発した。
論文 参考訳(メタデータ) (2020-01-26T02:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。