論文の概要: CofeNet: Context and Former-Label Enhanced Net for Complicated Quotation
Extraction
- arxiv url: http://arxiv.org/abs/2209.09432v1
- Date: Tue, 20 Sep 2022 03:00:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 17:34:47.637602
- Title: CofeNet: Context and Former-Label Enhanced Net for Complicated Quotation
Extraction
- Title(参考訳): CofeNet: 複雑な引用抽出のためのコンテキストと元ラベル拡張ネット
- Authors: Yequan Wang, Xiang Li, Aixin Sun, Xuying Meng, Huaming Liao, Jiafeng
Guo
- Abstract要約: 引用抽出のためのコンテキストと元ラベル拡張ネット(CofeNet)を提案する。
CofeNetは、可変長と複雑な構造を持つコンポーネントで複雑な引用を抽出することができる。
- 参考スコア(独自算出の注目度): 39.780659976718745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quotation extraction aims to extract quotations from written text. There are
three components in a quotation: source refers to the holder of the quotation,
cue is the trigger word(s), and content is the main body. Existing solutions
for quotation extraction mainly utilize rule-based approaches and sequence
labeling models. While rule-based approaches often lead to low recalls,
sequence labeling models cannot well handle quotations with complicated
structures. In this paper, we propose the Context and Former-Label Enhanced Net
(CofeNet) for quotation extraction. CofeNet is able to extract complicated
quotations with components of variable lengths and complicated structures. On
two public datasets (i.e., PolNeAR and Riqua) and one proprietary dataset
(i.e., PoliticsZH), we show that our CofeNet achieves state-of-the-art
performance on complicated quotation extraction.
- Abstract(参考訳): 引用抽出は、文章から引用を抽出することを目的としている。
引用には3つの要素がある: ソースは引用の保持者を指し、キューはトリガーワードであり、コンテンツは本体である。
引用抽出のための既存のソリューションは主にルールベースのアプローチとシーケンスラベリングモデルを利用している。
ルールベースのアプローチはしばしばリコールを少なくするが、シーケンスラベリングモデルは複雑な構造を持つ引用をうまく扱えない。
本稿では、引用抽出のためのContext and former-Label Enhanced Net(CofeNet)を提案する。
CofeNetは可変長と複雑な構造を持つ複雑な引用を抽出することができる。
2つの公開データセット(すなわち PolNeAR と Riqua)と1つのプロプライエタリデータセット(すなわち PoliticsZH)では、複雑な引用抽出でCofeNetが最先端のパフォーマンスを達成することを示す。
関連論文リスト
- Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Structured information extraction from complex scientific text with
fine-tuned large language models [55.96705756327738]
そこで本研究では,共振器認識と関係抽出のための簡単なシーケンス・ツー・シーケンス手法を提案する。
このアプローチは、約500組のプロンプトで微調整された、事前訓練済みの大規模言語モデル(LLM)であるGPT-3を利用する。
このアプローチは、構造化されていないテキストから抽出された構造化知識の大規模なデータベースを得るための、シンプルで、アクセス可能で、非常に柔軟な経路を示す。
論文 参考訳(メタデータ) (2022-12-10T07:51:52Z) - Not Just Plain Text! Fuel Document-Level Relation Extraction with
Explicit Syntax Refinement and Subsentence Modeling [3.9436257406798925]
expLicit syntAx Refinement and Subsentence mOdeliNg based framework (LARSON)を提案する。
余分な構文情報を導入することで、LARSONは任意の粒度のサブ文をモデル化し、効果的なインストラクティブを表示できる。
3つのベンチマークデータセット(DocRED、CDR、GDA)の実験結果から、LARSONは既存の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-11-10T05:06:37Z) - RelationPrompt: Leveraging Prompts to Generate Synthetic Data for
Zero-Shot Relation Triplet Extraction [65.4337085607711]
ゼロショット関係トリプルト抽出(ZeroRTE)のタスク設定について紹介する。
入力文が与えられた後、抽出された各三重項は、トレーニング段階で関係ラベルが見えないヘッドエンティティ、リレーションラベル、テールエンティティから構成される。
本稿では、言語モデルに構造化テキストを生成するよう促すことで、関係例を合成する。
論文 参考訳(メタデータ) (2022-03-17T05:55:14Z) - ASET: Ad-hoc Structured Exploration of Text Collections [Extended
Abstract] [12.061875724791648]
ASETは、ユーザーがアドホックな方法でテキストコレクションの構造化された探索を行うことを可能にする。
実世界のテキストコレクションから構造化されたデータを,事前の抽出パイプラインを設計することなく,高品質に抽出できることを示す。
論文 参考訳(メタデータ) (2022-03-09T12:02:17Z) - DirectQuote: A Dataset for Direct Quotation Extraction and Attribution
in News Articles [6.006936459950188]
本稿では,オンラインメディアから手動で注釈付けされた19,760段落と10,279の直接引用を含むコーパスであるDirectQuoteを紹介する。
提案手法は,複数のシーケンスラベリングモデルをベースラインとして提案し,提案手法をエンド・ツー・エンドで同時抽出・属性付けする手法である。
論文 参考訳(メタデータ) (2021-10-15T02:50:09Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Dual Attention Model for Citation Recommendation [7.244791479777266]
我々は「引用レコメンデーションのためのデュアルアテンションモデル」と呼ばれる新しい埋め込み型ニューラルネットワークを提案する。
ニューラルネットワークは、3つの入力(ローカルコンテキストワード、セクション、構造コンテキスト)の埋め込みと、コンテキストに現れる対象の引用との類似性を最大化するように設計されている。
論文 参考訳(メタデータ) (2020-10-01T02:41:47Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Abstractive Snippet Generation [39.30483409765206]
抽象スニペット(英: abstractive snippet)とは、検索エンジンの検索結果ページのWebページを要約するために作成されたテキストである。
本稿では,遠隔監視のための2つの大規模ソース,すなわちアンカーコンテキストとWebディレクトリを識別する,抽象スニペット生成のための新しいアプローチを提案する。
本稿では,2方向の抽象スニペット生成モデルを提案し,コーパスと生成した抽象スニペットの品質を標準尺度,クラウドソーシング,および技術状況と比較して評価する。
論文 参考訳(メタデータ) (2020-02-25T10:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。