論文の概要: Russian News Clustering and Headline Selection Shared Task
- arxiv url: http://arxiv.org/abs/2105.00981v1
- Date: Mon, 3 May 2021 16:32:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 14:07:27.298616
- Title: Russian News Clustering and Headline Selection Shared Task
- Title(参考訳): ロシアのニュースクラスタリングと見出し選択共有タスク
- Authors: Ilya Gusev, Ivan Smurov
- Abstract要約: 本稿では,ロシアのニュースイベント検出,見出し選択,見出し生成の課題を提案する。
イベント検出と見出し選択のための提示されたデータセットは、彼らのタスクのための最初の公開ロシアのデータセットです。
共有タスク参加者が提案するアプローチを報告および分析します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the results of the Russian News Clustering and Headline
Selection shared task. As a part of it, we propose the tasks of Russian news
event detection, headline selection, and headline generation. These tasks are
accompanied by datasets and baselines. The presented datasets for event
detection and headline selection are the first public Russian datasets for
their tasks. The headline generation dataset is based on clustering and
provides multiple reference headlines for every cluster, unlike the previous
datasets. Finally, the approaches proposed by the shared task participants are
reported and analyzed.
- Abstract(参考訳): 本稿では,ロシア語ニュースクラスタリングと見出し選択共有タスクの結果について述べる。
その中のひとつとして,ロシアのニュースイベント検出,見出し選択,見出し生成のタスクを提案する。
これらのタスクにはデータセットとベースラインが伴う。
イベント検出と見出し選択のための提示されたデータセットは、彼らのタスクのための最初の公開ロシアのデータセットである。
ヘッドライン生成データセットはクラスタリングに基づいており、以前のデータセットとは異なり、クラスタ毎に複数の参照ヘッドラインを提供する。
最後に、共有タスク参加者が提案するアプローチを報告し、分析する。
関連論文リスト
- TeClass: A Human-Annotated Relevance-based Headline Classification and Generation Dataset for Telugu [4.272315504476224]
関連性に基づく見出し分類は、関連する見出しを生成するタスクを大いに助ける。
本稿では,TeClassについて紹介する。
ROUGE-Lスコアの約5ポイント向上を示した。
論文 参考訳(メタデータ) (2024-04-17T13:07:56Z) - A diverse Multilingual News Headlines Dataset from around the World [57.37355895609648]
Babel Briefingsは、2020年8月から2021年11月までの470万のニュースの見出しを、世界中の30の言語と54の場所にわたって掲載した、新しいデータセットである。
言語モデルのトレーニングや評価のための高品質なデータセットとして機能し、単純でアクセスしやすい記事のコレクションを提供する。
論文 参考訳(メタデータ) (2024-03-28T12:08:39Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - ClusTop: An unsupervised and integrated text clustering and topic
extraction framework [3.3073775218038883]
教師なしテキストクラスタリングとトピック抽出フレームワーク(ClusTop)を提案する。
フレームワークには、拡張言語モデルトレーニング、次元削減、クラスタリング、トピック抽出の4つのコンポーネントが含まれている。
2つのデータセットの実験は、我々のフレームワークの有効性を実証している。
論文 参考訳(メタデータ) (2023-01-03T03:26:26Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Dataset for Automatic Summarization of Russian News [0.0]
ロシアのニュースを要約する最初のデータセットであるGazetaを紹介します。
このデータセットがロシア語のテキスト要約手法の有効なタスクであることを実証する。
論文 参考訳(メタデータ) (2020-06-19T10:44:06Z) - RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the
Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。
16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文 参考訳(メタデータ) (2020-05-22T13:30:37Z) - Low resource language dataset creation, curation and classification:
Setswana and Sepedi -- Extended Abstract [2.3801001093799115]
SetswanaとSepediのニュースの見出しに焦点を当てたデータセットを作成します。
分類のためのベースラインを提案し,低リソース言語に適したデータ拡張手法について検討する。
論文 参考訳(メタデータ) (2020-03-30T18:03:15Z) - Investigating an approach for low resource language dataset creation,
curation and classification: Setswana and Sepedi [2.3801001093799115]
SetswanaとSepediのニュースの見出しに焦点を当てたデータセットを作成します。
ニューストピックの分類タスクも作成します。
本稿では,低リソース言語に適したデータ拡張手法について検討する。
論文 参考訳(メタデータ) (2020-02-18T13:58:06Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。