論文の概要: SenSeNet: Neural Keyphrase Generation with Document Structure
- arxiv url: http://arxiv.org/abs/2012.06754v1
- Date: Sat, 12 Dec 2020 08:21:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 09:33:10.642515
- Title: SenSeNet: Neural Keyphrase Generation with Document Structure
- Title(参考訳): SenSeNet: ドキュメント構造を備えたニューラルキーフレーズ生成
- Authors: Yichao Luo, Zhengyan Li, Bingning Wang, Xiaoyu Xing, Qi Zhang,
Xuanjing Huang
- Abstract要約: メタセンテンス誘導バイアスをキーフレーズ生成(KG)に組み込むSentence Selective Network(SenSeNet)という新しい手法を提案する。
SenSeNetは、seq2seqフレームワークに基づいて主要なKGモデルのパフォーマンスを一貫して改善できます。
- 参考スコア(独自算出の注目度): 42.641790028836795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keyphrase Generation (KG) is the task of generating central topics from a
given document or literary work, which captures the crucial information
necessary to understand the content. Documents such as scientific literature
contain rich meta-sentence information, which represents the logical-semantic
structure of the documents. However, previous approaches ignore the constraints
of document logical structure, and hence they mistakenly generate keyphrases
from unimportant sentences. To address this problem, we propose a new method
called Sentence Selective Network (SenSeNet) to incorporate the meta-sentence
inductive bias into KG. In SenSeNet, we use a straight-through estimator for
end-to-end training and incorporate weak supervision in the training of the
sentence selection module. Experimental results show that SenSeNet can
consistently improve the performance of major KG models based on seq2seq
framework, which demonstrate the effectiveness of capturing structural
information and distinguishing the significance of sentences in KG task.
- Abstract(参考訳): キーフレーズ生成(英: keyphrase generation、kg)は、特定の文書や文学作品から中心的なトピックを生成するタスクであり、内容を理解するために必要な重要な情報をキャプチャする。
科学文献などの文書には、文書の論理的意味構造を表す豊富なメタ文情報が含まれている。
しかし、以前のアプローチでは、文書論理構造の制約を無視し、誤って重要でない文からキーフレーズを生成する。
そこで本研究では,メタセンス誘導バイアスをKGに組み込むSentence Selective Network(SenSeNet)を提案する。
SenSeNetでは、エンドツーエンドのトレーニングにストレートスルー推定器を使用し、文選択モジュールのトレーニングに弱い監督を組み込む。
実験結果から,SenSeNetは,構造情報の取得とKGタスクにおける文の意義の識別の有効性を示すセq2seqフレームワークに基づいて,主要なKGモデルの性能を一貫して向上させることができることがわかった。
関連論文リスト
- SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Large Language Model Prompt Chaining for Long Legal Document
Classification [2.3148470932285665]
チェイン(Chaining)は、複雑なタスクを小さな管理可能なコンポーネントに分解する戦略である。
即時連鎖により、ゼロショット以上の性能を向上できるだけでなく、より大きなモデルによって達成されたマイクロF1スコアを超越できることを実証する。
論文 参考訳(メタデータ) (2023-08-08T08:57:01Z) - HanoiT: Enhancing Context-aware Translation via Selective Context [95.93730812799798]
コンテキスト対応ニューラルネットワーク翻訳は、文書レベルのコンテキストを使用して翻訳品質を改善することを目的としている。
無関係または自明な単語は、いくつかのノイズをもたらし、モデルが現在の文と補助的な文脈の関係を学ぶのを邪魔する可能性がある。
そこで本稿では,階層的選択機構を備えたエンド・ツー・エンドのエンコーダ・デコーダモデルを提案する。
論文 参考訳(メタデータ) (2023-01-17T12:07:13Z) - ConTextual Mask Auto-Encoder for Dense Passage Retrieval [49.49460769701308]
CoT-MAEは,高密度経路抽出のための簡易かつ効果的な生成前訓練法である。
文のセマンティクスを高密度ベクトルに圧縮する学習は、自己教師付きおよび文脈教師付きマスキングによる自動エンコーディングによって行われる。
我々は,大規模経路探索ベンチマークの実験を行い,強力なベースラインよりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2022-08-16T11:17:22Z) - Syntax Controlled Knowledge Graph-to-Text Generation with Order and
Semantic Consistency [10.7334441041015]
知識グラフ・トゥ・テキスト(KG-to-text)生成は、知識グラフから分かりやすい文章を生成することを目的としている。
本稿では,キャプションから抽出した注文監督の下での知識記述順序予測を最適化する。
我々は、KGの単語をコピーする位置を制限するために、POS構文タグを組み込んだ。
論文 参考訳(メタデータ) (2022-07-02T02:42:14Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Select, Extract and Generate: Neural Keyphrase Generation with
Layer-wise Coverage Attention [75.44523978180317]
本稿では,2つの主要成分からなるニューラルキーフレーズ生成モデルであるemphSEG-Netを提案する。
科学的およびWeb文書から得られた7つのキーフレーズ生成ベンチマークの実験結果は、SEG-Netが最先端のニューラル生成手法よりも大きなマージンで優れていることを示している。
論文 参考訳(メタデータ) (2020-08-04T18:00:07Z) - Keyphrase Generation with Cross-Document Attention [28.565813544820553]
キーワード生成は、与えられた文書の本質を要約した一連のフレーズを作成することを目的としている。
本稿では,トランスフォーマーをグローバルな注目を集めるキーフレーズ生成装置CDKGenを提案する。
また,キーフレーズ中の語彙外単語を扱うために,文書から適切な単語を選択することで,モデルを強化するコピー機構も採用している。
論文 参考訳(メタデータ) (2020-04-21T07:58:27Z) - Selective Attention Encoders by Syntactic Graph Convolutional Networks
for Document Summarization [21.351111598564987]
本稿では,文書中の文から解析木を接続するグラフを提案し,文書の構文表現を学習するために重ねられたグラフ畳み込みネットワーク(GCN)を利用する。
提案したGCNによる選択的アテンションアプローチは,ベースラインよりも優れ,データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-18T01:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。