論文の概要: Improving Joint Layer RNN based Keyphrase Extraction by Using
Syntactical Features
- arxiv url: http://arxiv.org/abs/2009.07119v1
- Date: Tue, 15 Sep 2020 14:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 06:06:38.104142
- Title: Improving Joint Layer RNN based Keyphrase Extraction by Using
Syntactical Features
- Title(参考訳): 構文特徴を用いた関節層rnnに基づくキーフレーズ抽出の改善
- Authors: Miftahul Mahfuzh, Sidik Soleman, Ayu Purwarianti
- Abstract要約: 我々は,複数のキーワード列を抽出するために,JRNNの入力層を変更することを提案する。
精度は9597,F1は7691であった。
- 参考スコア(独自算出の注目度): 0.6724914680904501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrase extraction as a task to identify important words or phrases from a
text, is a crucial process to identify main topics when analyzing texts from a
social media platform. In our study, we focus on text written in Indonesia
language taken from Twitter. Different from the original joint layer recurrent
neural network (JRNN) with output of one sequence of keywords and using only
word embedding, here we propose to modify the input layer of JRNN to extract
more than one sequence of keywords by additional information of syntactical
features, namely part of speech, named entity types, and dependency structures.
Since JRNN in general requires a large amount of data as the training examples
and creating those examples is expensive, we used a data augmentation method to
increase the number of training examples. Our experiment had shown that our
method outperformed the baseline methods. Our method achieved .9597 in accuracy
and .7691 in F1.
- Abstract(参考訳): キーワード抽出は、テキストから重要な単語やフレーズを識別するタスクであり、ソーシャルメディアプラットフォームからテキストを分析する際、主要なトピックを識別する重要なプロセスである。
本研究では,インドネシア語で書かれたテキストをTwitterから抽出した。
本稿では,1つのキーワード列を出力し,単語埋め込みのみを用いることで,元の関節層リカレントニューラルネットワーク(JRNN)とは違って,音声の一部,名前付きエンティティタイプ,依存関係構造といった構文的特徴の付加情報を用いて,複数のキーワード列を抽出するために,JRNNの入力層を変更することを提案する。
JRNNは,トレーニング例として大量のデータを必要とし,それらの作成には費用がかかるため,トレーニング例の数を増やすためにデータ拡張手法を用いた。
実験の結果,本手法がベースライン法を上回った。
精度は.9597、F1は.7691であった。
関連論文リスト
- Data Augmentation for Low-Resource Keyphrase Generation [46.52115499306222]
キーフレーズ生成(英: Keyphrase generation)とは、任意の記事の内容をいくつかの有能なフレーズ(またはキーフレーズ)に要約するタスクである。
タスクの既存の作業は主に、取得が簡単ではない大規模なアノテートデータセットに依存しています。
我々は、純粋にリソース制約のあるドメインにおいて、キーフレーズの生成に対処するためのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2023-05-29T09:20:34Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Learning Rich Representation of Keyphrases from Text [12.698835743464313]
テキスト文書からキーフレーズの表現を豊かに学習することを目的としたタスク固有言語モデルの学習方法を示す。
差別的設定では、新しい事前学習目標である、KBIR(Keyphrase boundary Infilling with Replacement)を導入する。
生成設定では、入力テキストに関連するキーフレーズをCatSeqフォーマットで再現する、BART-KeyBARTの新しい事前学習設定を導入する。
論文 参考訳(メタデータ) (2021-12-16T01:09:51Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding [3.7110020502717616]
我々は,変換器とグラフ埋め込み技術を用いて,多モーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
Inspec、SemEval2010、SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析する。
論文 参考訳(メタデータ) (2021-06-09T09:32:17Z) - Semi-supervised URL Segmentation with Recurrent Neural Networks
Pre-trained on Knowledge Graph Entities [8.855143852360328]
本稿では,文字を入力として使用したリカレントニューラルネットワーク(RNN)に基づくタグ付けモデルの有効性を示す。
学習データ不足を補うため,大規模な知識データベースにおいて,合成エンティティ名の事前学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-05T23:31:00Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Select, Extract and Generate: Neural Keyphrase Generation with
Layer-wise Coverage Attention [75.44523978180317]
本稿では,2つの主要成分からなるニューラルキーフレーズ生成モデルであるemphSEG-Netを提案する。
科学的およびWeb文書から得られた7つのキーフレーズ生成ベンチマークの実験結果は、SEG-Netが最先端のニューラル生成手法よりも大きなマージンで優れていることを示している。
論文 参考訳(メタデータ) (2020-08-04T18:00:07Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。