論文の概要: Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding
- arxiv url: http://arxiv.org/abs/2106.04939v1
- Date: Wed, 9 Jun 2021 09:32:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 15:34:22.527843
- Title: Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding
- Title(参考訳): Phraseformer: Transformer と Graph Embedding を用いたマルチモーダルキーフレーズ抽出
- Authors: Narjes Nikzad-Khasmakhi, Mohammad-Reza Feizi-Derakhshi, Meysam
Asgari-Chenaghlu, Mohammad-Ali Balafar, Ali-Reza Feizi-Derakhshi, Taymaz
Rahkar-Farshi, Majid Ramezani, Zoleikha Jahanbakhsh-Nagadeh, Elnaz
Zafarani-Moattar, Mehrdad Ranjbar-Khadivi
- Abstract要約: 我々は,変換器とグラフ埋め込み技術を用いて,多モーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
Inspec、SemEval2010、SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析する。
- 参考スコア(独自算出の注目度): 3.7110020502717616
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Background: Keyword extraction is a popular research topic in the field of
natural language processing. Keywords are terms that describe the most relevant
information in a document. The main problem that researchers are facing is how
to efficiently and accurately extract the core keywords from a document.
However, previous keyword extraction approaches have utilized the text and
graph features, there is the lack of models that can properly learn and combine
these features in a best way.
Methods: In this paper, we develop a multimodal Key-phrase extraction
approach, namely Phraseformer, using transformer and graph embedding
techniques. In Phraseformer, each keyword candidate is presented by a vector
which is the concatenation of the text and structure learning representations.
Phraseformer takes the advantages of recent researches such as BERT and ExEm to
preserve both representations. Also, the Phraseformer treats the key-phrase
extraction task as a sequence labeling problem solved using classification
task.
Results: We analyze the performance of Phraseformer on three datasets
including Inspec, SemEval2010 and SemEval 2017 by F1-score. Also, we
investigate the performance of different classifiers on Phraseformer method
over Inspec dataset. Experimental results demonstrate the effectiveness of
Phraseformer method over the three datasets used. Additionally, the Random
Forest classifier gain the highest F1-score among all classifiers.
Conclusions: Due to the fact that the combination of BERT and ExEm is more
meaningful and can better represent the semantic of words. Hence, Phraseformer
significantly outperforms single-modality methods.
- Abstract(参考訳): 背景: キーワード抽出は自然言語処理の分野で人気のある研究トピックである。
キーワードは文書の中で最も重要な情報を記述する用語である。
研究者が直面している主な問題は、ドキュメントからコアキーワードを効率的に正確に抽出する方法である。
しかし,従来のキーワード抽出手法ではテキストとグラフの特徴が活用されているため,これらの特徴を適切に学習し組み合わせることのできるモデルが不足している。
方法:本論文では,変換器とグラフ埋め込み技術を用いたマルチモーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
PhraseformerはBERTやExEmといった最近の研究の利点を利用して両方の表現を保存する。
また、フレーズフォーマは、キーフレーズ抽出タスクを分類タスクを用いて解決されたシーケンスラベリング問題として扱う。
結果: Inspec, SemEval2010, SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析した。
また,inspec データセット上の phraseformer メソッドにおける異なる分類器の性能について検討する。
実験の結果,3つのデータセットに対して phraseformer 法の有効性が示された。
さらに、ランダムフォレスト分類器は全ての分類器の中で最高F1スコアを得る。
結論: bert と exem の組み合わせがより意味があり、単語の意味をよりよく表現できるという事実から。
したがって、 phraseformer は単一モダリティメソッドを大幅に上回っている。
関連論文リスト
- BibRank: Automatic Keyphrase Extraction Platform Using~Metadata [0.0]
本稿では、キーフレーズデータセットを統合し、キーフレーズ抽出アルゴリズムの評価を容易にするプラットフォームを提案する。
このプラットフォームには、単語をBib形式で解析することで得られる豊富なデータセットを活用する自動キーフレーズ抽出アルゴリズムであるBibRankが含まれている。
論文 参考訳(メタデータ) (2023-10-13T14:44:34Z) - Towards Better Multi-modal Keyphrase Generation via Visual Entity
Enhancement and Multi-granularity Image Noise Filtering [79.44443231700201]
マルチモーダルなキーフレーズ生成は、入力されたテキストイメージペアのコアポイントを表すキーフレーズのセットを作成することを目的としている。
入力されたテキストと画像はしばしば完全に一致しないので、画像はモデルにノイズをもたらす可能性がある。
本稿では,モデル入力を外部知識で豊かにするだけでなく,画像ノイズを効果的にフィルタする,新しいマルチモーダル・キーフレーズ生成モデルを提案する。
論文 参考訳(メタデータ) (2023-09-09T09:41:36Z) - Applying Transformer-based Text Summarization for Keyphrase Generation [2.28438857884398]
キーフレーズは学術文書の検索と体系化に不可欠である。
本稿では,抽象的なテキスト要約のためのトランスフォーマーモデルについて実験する。
要約モデルはフルマッチのF1スコアとBERTスコアでキーフレーズを生成するのに非常に効果的であることを示す。
また,キーフレーズをターゲットとした順序付け戦略についても検討する。
論文 参考訳(メタデータ) (2022-09-08T13:01:52Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Importance Estimation from Multiple Perspectives for Keyphrase
Extraction [34.51718374923614]
複数視点からキーフレーズの重要性を推定する新しい手法を提案する(textitKIEMP)。
textitKIEMPは、構文的正確性を測定するチャンキングモジュール、情報の正確性をチェックするランキングモジュール、フレーズとドキュメント全体の概念整合性を判断するマッチングモジュールの3つのモジュールで、フレーズの重要性を見積もっている。
6つのベンチマークデータセットの実験結果から、textitKIEMPは、ほとんどの場合、既存の最先端のキーフレーズ抽出手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-19T05:48:22Z) - MatchVIE: Exploiting Match Relevancy between Entities for Visual
Information Extraction [48.55908127994688]
我々は、VIE(MatchVIE)のためのグラフニューラルネットワークに基づく新しいキー値マッチングモデルを提案する。
関連性評価に基づくキー値マッチングにより、提案したMatchVIEは、認識を様々な意味論にバイパスすることができる。
我々は、エンコードされた値の不安定性に対処するために、単純だが効果的な操作であるNum2Vecを導入する。
論文 参考訳(メタデータ) (2021-06-24T12:06:29Z) - FRAKE: Fusional Real-time Automatic Keyword Extraction [1.332091725929965]
キーワード抽出は、テキストの主要な概念を最もよく表す単語やフレーズを識別する。
グラフ中心性特徴とテキスト特徴の2つのモデルを組み合わせたアプローチを採用している。
論文 参考訳(メタデータ) (2021-04-10T18:30:17Z) - Match-Ignition: Plugging PageRank into Transformer for Long-form Text
Matching [66.71886789848472]
実効性と効率性に対処する新しい階層型ノイズフィルタリングモデルであるMatch-Ignitionを提案する。
基本的なアイデアは、よく知られたPageRankアルゴリズムをTransformerに接続し、文と単語レベルの騒々しい情報を識別およびフィルタリングすることです。
文が長文の基本単位であるため、ノイズの多い文はたいてい簡単に検出できるので、PageRankを直接使用してそのような情報をフィルタリングする。
論文 参考訳(メタデータ) (2021-01-16T10:34:03Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。