論文の概要: News Meets Microblog: Hashtag Annotation via Retriever-Generator
- arxiv url: http://arxiv.org/abs/2104.08723v1
- Date: Sun, 18 Apr 2021 05:28:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 10:47:44.018359
- Title: News Meets Microblog: Hashtag Annotation via Retriever-Generator
- Title(参考訳): news meets microblog:リトリーバー生成者によるハッシュタグアノテーション
- Authors: Xiuwen Zheng, Dheeraj Mekala, Amarnath Gupta, Jingbo Shang
- Abstract要約: マイクロブログ投稿の前に公開されたニュース記事を利用して、Retriever-Generatorフレームワークに従ってハッシュタグを生成することを提案します。
英語のTwitterデータセットの実験は、ニュース記事を利用してハッシュタグを生成する優れたパフォーマンスと大きな利点を示しています。
- 参考スコア(独自算出の注目度): 15.558878116343585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hashtag annotation for microblog posts has been recently formulated as a
sequence generation problem to handle emerging hashtags that are unseen in the
training set. The state-of-the-art method leverages conversations initiated by
posts to enrich contextual information for the short posts. However, it is
unrealistic to assume the existence of conversations before the hashtag
annotation itself. Therefore, we propose to leverage news articles published
before the microblog post to generate hashtags following a Retriever-Generator
framework. Extensive experiments on English Twitter datasets demonstrate
superior performance and significant advantages of leveraging news articles to
generate hashtags.
- Abstract(参考訳): マイクロブログ投稿のためのハッシュタグアノテーションは、トレーニングセットにない新しいハッシュタグを扱うシーケンス生成問題として最近定式化されている。
State-of-the-artメソッドは、投稿によって開始された会話を利用して、短い投稿のコンテキスト情報を強化する。
しかし、ハッシュタグアノテーション自体よりも前に会話の存在を仮定するのは現実的ではない。
そこで本稿では,マイクロブログ投稿の前に掲載したニュース記事を利用して,Retriever-Generatorフレームワークに従ってハッシュタグを生成する。
英語のtwitterデータセットに関する広範な実験は、ハッシュタグを生成するためにニュース記事を活用するという優れたパフォーマンスと重要な利点を示している。
関連論文リスト
- RIGHT: Retrieval-augmented Generation for Mainstream Hashtag
Recommendation [76.24205422163169]
我々はRIGHT(RetrIeval-augmented Generative Mainstream HashTag Recommender)を提案する。
RIGHTは3つのコンポーネントから構成される: 1) 検索者は、ツイートハッシュタグセット全体から関連するハッシュタグを検索する; 2) セレクタは、グローバル信号を導入して、メインストリームの識別を強化する; 3) ジェネレータは入力されたつぶやきと選択されたハッシュタグを組み込んで、目的のハッシュタグを直接生成する。
さらに,RIGHTを大規模言語モデルに統合することで,ChatGPTの性能を10%以上向上させることができる。
論文 参考訳(メタデータ) (2023-12-16T14:47:03Z) - Data Augmentation for Low-Resource Keyphrase Generation [46.52115499306222]
キーフレーズ生成(英: Keyphrase generation)とは、任意の記事の内容をいくつかの有能なフレーズ(またはキーフレーズ)に要約するタスクである。
タスクの既存の作業は主に、取得が簡単ではない大規模なアノテートデータセットに依存しています。
我々は、純粋にリソース制約のあるドメインにおいて、キーフレーズの生成に対処するためのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2023-05-29T09:20:34Z) - Hashtag-Guided Low-Resource Tweet Classification [31.810562621519804]
ハッシュタグ誘導型つぶやき分類モデル(HashTation)を提案する。
HashTationは、入力ツイートの有意義なハッシュタグを自動的に生成し、ツイート分類に有用な補助信号を提供する。
実験によると、HashTationは7つの低リソースのつぶやき分類タスクで大幅に改善されている。
論文 参考訳(メタデータ) (2023-02-20T18:21:02Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - HashSet -- A Dataset For Hashtag Segmentation [19.016545782774003]
モデルパフォーマンスは、より広範囲のハッシュタグで評価されるべきである、と我々は主張する。
我々は、a) 1.9kのマニュアルアノテーション付きデータセット、b) 3.3Mの緩やかな教師付きデータセットからなるデータセットであるHashSetを提案する。
HashtagのSOTAモデルの性能は,提案したデータセット上で大幅に低下することを示す。
論文 参考訳(メタデータ) (2022-01-18T04:40:45Z) - Attend and Select: A Segment Attention based Selection Mechanism for
Microblog Hashtag Generation [69.73215951112452]
ハッシュタグは、原文の様々な断片的な部分に由来する可能性のあるトークンまたはフレーズによって形成される。
本稿では,エンコーディング,セグメント選択,デコードという3つのフェーズからなるエンドツーエンドのトランスフォーマーベース生成モデルを提案する。
中国語のWeiboと英語のTwitterから新たに収集した2つの大規模ハッシュタグ生成データセットを紹介する。
論文 参考訳(メタデータ) (2021-06-06T15:13:58Z) - Diverse, Controllable, and Keyphrase-Aware: A Corpus and Method for News
Multi-Headline Generation [98.98411895250774]
ユーザ関心のキーワードで複数の見出しを生成することを提案する。
提案手法は,品質と多様性の観点から,最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-04-08T08:30:05Z) - On Identifying Hashtags in Disaster Twitter Data [55.17975121160699]
我々は,行動可能な情報をフィルタリングするのに有用なハッシュタグを付加した災害関連ツイートのユニークなデータセットを構築した。
このデータセットを用いて,マルチタスク学習フレームワークにおける長期記憶モデルについて検討する。
最高のパフォーマンスモデルでは、F1スコアは92.22%に達する。
論文 参考訳(メタデータ) (2020-01-05T22:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。