論文の概要: IMoJIE: Iterative Memory-Based Joint Open Information Extraction
- arxiv url: http://arxiv.org/abs/2005.08178v1
- Date: Sun, 17 May 2020 07:04:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 05:24:44.357554
- Title: IMoJIE: Iterative Memory-Based Joint Open Information Extraction
- Title(参考訳): IMOJIE:イテレーティブメモリベース共同オープン情報抽出
- Authors: Keshav Kolluru, Samarth Aggarwal, Vipul Rathore, Mausam and Soumen
Chakrabarti
- Abstract要約: 提案するIMojieはCopyAttentionの拡張であり, 従来抽出した全データに対して次の抽出条件を導出する。
IMoJIEはCopyAttentionを約18F1pt、BERTベースの強力なベースラインを2F1ptで上回る。
- 参考スコア(独自算出の注目度): 37.487044478970965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While traditional systems for Open Information Extraction were statistical
and rule-based, recently neural models have been introduced for the task. Our
work builds upon CopyAttention, a sequence generation OpenIE model (Cui et.
al., 2018). Our analysis reveals that CopyAttention produces a constant number
of extractions per sentence, and its extracted tuples often express redundant
information.
We present IMoJIE, an extension to CopyAttention, which produces the next
extraction conditioned on all previously extracted tuples. This approach
overcomes both shortcomings of CopyAttention, resulting in a variable number of
diverse extractions per sentence. We train IMoJIE on training data bootstrapped
from extractions of several non-neural systems, which have been automatically
filtered to reduce redundancy and noise. IMoJIE outperforms CopyAttention by
about 18 F1 pts, and a BERT-based strong baseline by 2 F1 pts, establishing a
new state of the art for the task.
- Abstract(参考訳): オープン情報抽出のための従来のシステムは統計的かつルールベースであったが、近年はニューラルモデルが導入されている。
当社の作業は,シーケンス生成OpenIEモデルであるCopyAttention(Cui et al., 2018)をベースにしています。
解析の結果,CopyAttentionは文毎に一定数の抽出を発生し,抽出したタプルは冗長な情報を表現していることがわかった。
今回提案するIMoJIEはCopyAttentionの拡張であり, これまでに抽出したタプルに対して次なる抽出条件を導出する。
このアプローチはコピーアテンションの欠点を克服し、1文あたりのさまざまな抽出結果を生み出す。
複数の非神経系の抽出からブートストラップされたトレーニングデータに基づいてイモジエを訓練し,冗長性と雑音を低減するために自動フィルタリングを行った。
IMoJIEはCopyAttentionを約18F1ptで、BERTベースの強力なベースラインを2F1ptで上回り、タスクのための新しい最先端技術を確立する。
関連論文リスト
- Adapt-$\infty$: Scalable Lifelong Multimodal Instruction Tuning via Dynamic Data Selection [89.42023974249122]
Adapt-$infty$は、Lifelong Instruction Tuningの新しいマルチウェイおよびアダプティブデータ選択アプローチである。
勾配に基づくサンプルベクトルをグループ化して擬似スキルクラスタを構築する。
セレクタエキスパートのプールから各スキルクラスタの最高のパフォーマンスデータセレクタを選択する。
論文 参考訳(メタデータ) (2024-10-14T15:48:09Z) - Jointly Learning Span Extraction and Sequence Labeling for Information
Extraction from Business Documents [1.6249267147413522]
本稿では,ビジネス文書の新しい情報抽出モデルを提案する。
これは、スパン抽出とシーケンスラベリングの両方の利点を考慮に入れている。
このモデルは2つのタスクを共同で最適化するために、エンドツーエンドで訓練されている。
論文 参考訳(メタデータ) (2022-05-26T15:37:24Z) - Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction [11.344977846840747]
本稿では,三重項の異なる要素に対する抽出条件を条件付け,三重項を反復的に抽出する神経多言語OpenIEシステムを提案する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
論文 参考訳(メタデータ) (2021-10-15T15:19:11Z) - Document-level Entity-based Extraction as Template Generation [13.110360825201044]
本稿では2つの文書レベルEEタスクのための生成フレームワークを提案する: 役割充足者エンティティ抽出(REE)と関係抽出(RE)である。
まず、テンプレート生成問題として定式化し、モデルが依存性を効率的にキャプチャできるようにする。
キー情報の識別能力を高めるために、新しいクロスアテンションガイド付きコピー機構であるTopK Copyを事前訓練されたシーケンス・ツー・シーケンスモデルに組み込む。
論文 参考訳(メタデータ) (2021-09-10T14:18:22Z) - An Effective System for Multi-format Information Extraction [1.027461951217988]
2021年の言語とインテリジェンスチャレンジは、異なる次元からの情報抽出を評価するように設計されている。
本稿では,このマルチフォーマット情報抽出コンペティションタスクのシステムについて述べる。
本システムでは,このマルチフォーマット情報抽出作業において,テストセットのリーダボード上で4位にランクインしている。
論文 参考訳(メタデータ) (2021-08-16T08:25:17Z) - MemSum: Extractive Summarization of Long Documents using Multi-step
Episodic Markov Decision Processes [6.585259903186036]
本稿では,任意の時間ステップで濃縮された強化学習に基づく抽出要約器であるMemSumについて紹介する。
私たちのイノベーションは、このタスクで人間が直感的に使用するような要約を行う際に、より広範な情報セットを検討することです。
論文 参考訳(メタデータ) (2021-07-19T14:41:31Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Contrastive Triple Extraction with Generative Transformer [72.21467482853232]
生成変換器を用いた新しい3重抽出モデルを提案する。
具体的には,エンコーダデコーダをベースとした1つの共有トランスフォーマモジュールを提案する。
忠実な結果を得るために,新しい三重項コントラストトレーニングオブジェクトを提案する。
論文 参考訳(メタデータ) (2020-09-14T05:29:24Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。