論文の概要: Exclusive Hierarchical Decoding for Deep Keyphrase Generation
- arxiv url: http://arxiv.org/abs/2004.08511v1
- Date: Sat, 18 Apr 2020 02:58:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 05:17:14.599479
- Title: Exclusive Hierarchical Decoding for Deep Keyphrase Generation
- Title(参考訳): ディープキーフレーズ生成のための排他的階層化復号
- Authors: Wang Chen, Hou Pong Chan, Piji Li, Irwin King
- Abstract要約: キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 63.357895318562214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrase generation (KG) aims to summarize the main ideas of a document into
a set of keyphrases. A new setting is recently introduced into this problem, in
which, given a document, the model needs to predict a set of keyphrases and
simultaneously determine the appropriate number of keyphrases to produce.
Previous work in this setting employs a sequential decoding process to generate
keyphrases. However, such a decoding method ignores the intrinsic hierarchical
compositionality existing in the keyphrase set of a document. Moreover,
previous work tends to generate duplicated keyphrases, which wastes time and
computing resources. To overcome these limitations, we propose an exclusive
hierarchical decoding framework that includes a hierarchical decoding process
and either a soft or a hard exclusion mechanism. The hierarchical decoding
process is to explicitly model the hierarchical compositionality of a keyphrase
set. Both the soft and the hard exclusion mechanisms keep track of
previously-predicted keyphrases within a window size to enhance the diversity
of the generated keyphrases. Extensive experiments on multiple KG benchmark
datasets demonstrate the effectiveness of our method to generate less
duplicated and more accurate keyphrases.
- Abstract(参考訳): keyphrase generation (kg) は、文書の主要なアイデアを一連のキーフレーズにまとめることを目的としている。
この問題に最近導入された新しい設定では、ドキュメントが与えられた場合、モデルが一連のキーフレーズを予測し、生成するキーフレーズの数を同時に決定する必要がある。
この設定の以前の作業では、キーフレーズを生成するシーケンシャルなデコードプロセスが使用されている。
しかし、そのような復号法は、文書のキーフレーズ集合に存在する固有の階層的構成性を無視する。
さらに、以前の作業は重複したキーフレーズを生成する傾向があり、時間と計算資源を浪費する。
これらの制限を克服するために,階層的復号化プロセスとソフトまたはハード排他機構を含む排他的階層的復号化フレームワークを提案する。
階層的復号処理は、キーフレーズ集合の階層的構成性を明示的にモデル化することである。
ソフトおよびハード排除機構は、予め予測されたキーフレーズをウィンドウサイズ内に追跡し、生成したキーフレーズの多様性を高める。
複数のKGベンチマークデータセットに対する大規模な実験により、重複の少ないより正確なキーフレーズを生成する方法の有効性が示された。
関連論文リスト
- SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Neural Keyphrase Generation: Analysis and Evaluation [47.004575377472285]
本稿では,T5(事前学習型トランスフォーマー),CatSeq-Transformer(非事前学習型トランスフォーマー),ExHiRD(リカレントニューラルネットワーク)の3つの強力なモデルで示される傾向について検討する。
2つのキーフレーズの類似性を評価するために,SoftKeyScoreという新しいメトリクスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-27T00:10:21Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - One2Set: Generating Diverse Keyphrases as a Set [12.670421834049668]
キーフレーズの順序を事前に定義することなく,新たなトレーニングパラダイムであるOne2Setを提案する。
そこで本研究では,両部マッチングによる目標割当機構を提案する。これにより,多様性が大きく向上し,生成したキーフレーズの重複率を低減できる。
論文 参考訳(メタデータ) (2021-05-24T07:29:47Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Persian Keyphrase Generation Using Sequence-to-Sequence Models [1.192436948211501]
キーワードは入力テキストの要約であり、テキストで議論された主主題を提供する。
本稿では,キーフレーズ生成とニュース記事の抽出に,深いシーケンス・ツー・シーケンスモデルを用いて取り組む。
論文 参考訳(メタデータ) (2020-09-25T14:40:14Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。