論文の概要: One2Set: Generating Diverse Keyphrases as a Set
- arxiv url: http://arxiv.org/abs/2105.11134v1
- Date: Mon, 24 May 2021 07:29:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 15:31:24.639459
- Title: One2Set: Generating Diverse Keyphrases as a Set
- Title(参考訳): One2Set: 異なるキーワードをセットとして生成する
- Authors: Jiacheng Ye, Tao Gui, Yichao Luo, Yige Xu, Qi Zhang
- Abstract要約: キーフレーズの順序を事前に定義することなく,新たなトレーニングパラダイムであるOne2Setを提案する。
そこで本研究では,両部マッチングによる目標割当機構を提案する。これにより,多様性が大きく向上し,生成したキーフレーズの重複率を低減できる。
- 参考スコア(独自算出の注目度): 12.670421834049668
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, the sequence-to-sequence models have made remarkable progress on
the task of keyphrase generation (KG) by concatenating multiple keyphrases in a
predefined order as a target sequence during training. However, the keyphrases
are inherently an unordered set rather than an ordered sequence. Imposing a
predefined order will introduce wrong bias during training, which can highly
penalize shifts in the order between keyphrases. In this work, we propose a new
training paradigm One2Set without predefining an order to concatenate the
keyphrases. To fit this paradigm, we propose a novel model that utilizes a
fixed set of learned control codes as conditions to generate a set of
keyphrases in parallel. To solve the problem that there is no correspondence
between each prediction and target during training, we propose a $K$-step
target assignment mechanism via bipartite matching, which greatly increases the
diversity and reduces the duplication ratio of generated keyphrases. The
experimental results on multiple benchmarks demonstrate that our approach
significantly outperforms the state-of-the-art methods.
- Abstract(参考訳): 近年,訓練中に複数のキーフレーズを予め定義された順序で連結することで,キーフレーズ生成(kg)の課題に顕著な進歩を遂げている。
しかし、キーフレーズは本質的に順序列ではなく順序集合である。
事前定義された順序を設定すると、トレーニング中に誤ったバイアスが発生し、キーフレーズ間の順序のシフトを高いペナルティにすることができる。
本研究では,キーフレーズを結合する順序を事前に定義することなく,新しい学習パラダイムone2setを提案する。
このパラダイムを適合させるために, 学習制御符号の固定セットを条件として利用し, キーフレーズのセットを並列に生成する新しいモデルを提案する。
トレーニング中に各予測値と目標値が一致しないという問題を解決するため,両部マッチングによる目標割当機構を提案し,その多様性を大幅に向上させ,生成したキーフレーズの重複率を低減する。
複数のベンチマークによる実験結果から,本手法が最先端手法を著しく上回っていることが示された。
関連論文リスト
- Representation Learning of Tangled Key-Value Sequence Data for Early Classification [19.943311002522154]
キーバリューシーケンスデータはユビキタスになり、様々な現実世界のアプリケーションに自然に現れる。
これらのキーバリューシーケンスの分類は、ユーザプロファイリングや悪意のあるアプリケーション識別など、多くのシナリオにおいて重要である。
多くの時間に敏感なシナリオでは、キー値シーケンスを正確に分類することに加えて、キー値シーケンスを早期に分類することが望まれる。
論文 参考訳(メタデータ) (2024-04-11T03:23:15Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Instruction Position Matters in Sequence Generation with Large Language
Models [67.87516654892343]
大規模言語モデル(LLM)は、翻訳や要約といった条件付きシーケンス生成タスクを実行することができる。
入力文の後にタスク命令の位置をシフトさせることにより,LLMの指示追従能力を向上させることを提案する。
論文 参考訳(メタデータ) (2023-08-23T12:36:57Z) - Discovering Non-monotonic Autoregressive Orderings with Variational
Inference [67.27561153666211]
我々は、訓練データから高品質な生成順序を純粋に検出する、教師なし並列化可能な学習装置を開発した。
エンコーダを非因果的注意を持つトランスフォーマーとして実装し、1つのフォワードパスで置換を出力する。
言語モデリングタスクにおける経験的結果から,我々の手法は文脈認識であり,一定の順序と競合する,あるいはより優れた順序を見つけることができる。
論文 参考訳(メタデータ) (2021-10-27T16:08:09Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Neural Syntactic Preordering for Controlled Paraphrase Generation [57.5316011554622]
私たちの研究は、構文変換を使用して、ソース文をソフトに"リオーダー"し、神経パラフレージングモデルをガイドします。
まず、入力文が与えられた場合、エンコーダ・デコーダモデルを用いて、実行可能な構文再構成のセットを導出する。
次に、提案した各再構成を用いて位置埋め込みのシーケンスを生成し、最終的なエンコーダ-デコーダパラフレーズモデルが特定の順序でソース語に従属することを奨励する。
論文 参考訳(メタデータ) (2020-05-05T09:02:25Z) - Keyphrase Prediction With Pre-trained Language Model [16.06425973336514]
我々は,キーフレーズ予測を2つのサブタスク,すなわち,現在キーフレーズ抽出(PKE)と欠キーフレーズ生成(AKG)に分割することを提案する。
PKEでは、事前訓練された言語モデルBERTを用いて、このタスクをシーケンスラベリング問題として扱う。
AKG では,PKE から学んだキーフレーズの知識を細調整した BERT で完全に統合した Transformer ベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-22T09:35:02Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z) - Multi-level Head-wise Match and Aggregation in Transformer for Textual
Sequence Matching [87.97265483696613]
そこで本研究では,複数のレベルにおける頭部のマッチング表現を学習することで,Transformerとのシーケンスペアマッチングを新たに提案する。
実験の結果,提案手法は複数のタスクにおいて新しい最先端性能を実現することができることがわかった。
論文 参考訳(メタデータ) (2020-01-20T20:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。