論文の概要: RexUIE: A Recursive Method with Explicit Schema Instructor for Universal
Information Extraction
- arxiv url: http://arxiv.org/abs/2304.14770v2
- Date: Wed, 18 Oct 2023 02:30:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 20:41:50.764738
- Title: RexUIE: A Recursive Method with Explicit Schema Instructor for Universal
Information Extraction
- Title(参考訳): RexUIE:ユニバーサル情報抽出のための明示的スキーマインストラクタを用いた再帰的手法
- Authors: Chengyuan Liu, Fubang Zhao, Yangyang Kang, Jingyuan Zhang, Xiang Zhou,
Changlong Sun, Kun Kuang, Fei Wu
- Abstract要約: ユニバーサル情報抽出(Universal Information extract)は、さまざまなターゲット、異種構造、要求固有のスキーマによって引き起こされる課題によって、関心のある分野である。
これまでは、名前付きエンティティ認識(NER)や関係抽出(RE)など、いくつかのタスクを統合することで、限られた成功しか達成できなかった。
本稿では,ほぼすべての抽出スキーマを含む公式な定式化により,認証UIEを再定義する。
- 参考スコア(独自算出の注目度): 47.89362854989252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Universal Information Extraction (UIE) is an area of interest due to the
challenges posed by varying targets, heterogeneous structures, and
demand-specific schemas. However, previous works have only achieved limited
success by unifying a few tasks, such as Named Entity Recognition (NER) and
Relation Extraction (RE), which fall short of being authentic UIE models
particularly when extracting other general schemas such as quadruples and
quintuples. Additionally, these models used an implicit structural schema
instructor, which could lead to incorrect links between types, hindering the
model's generalization and performance in low-resource scenarios. In this
paper, we redefine the authentic UIE with a formal formulation that encompasses
almost all extraction schemas. To the best of our knowledge, we are the first
to introduce UIE for any kind of schemas. In addition, we propose RexUIE, which
is a Recursive Method with Explicit Schema Instructor for UIE. To avoid
interference between different types, we reset the position ids and attention
mask matrices. RexUIE shows strong performance under both full-shot and
few-shot settings and achieves State-of-the-Art results on the tasks of
extracting complex schemas.
- Abstract(参考訳): ユニバーサル情報抽出(UIE)は、様々なターゲット、異種構造、要求固有のスキーマによって引き起こされる課題により、関心のある分野である。
しかし、従来の作業は、名前付きエンティティ認識(NER)やリレーショナル抽出(RE)といった、特に四重項や四重項のような他の一般的なスキーマを抽出する場合に、真のUIEモデルに欠けるタスクを統一することで、限られた成功を収めただけである。
さらに、これらのモデルは暗黙的な構造スキーマインストラクタを使用しており、型間の誤ったリンクを引き起こし、低リソースシナリオにおけるモデルの一般化とパフォーマンスを妨げる可能性がある。
本稿では,ほぼすべての抽出スキーマを含む公式な定式化により,認証UIEを再定義する。
私たちの知る限りでは、どんな種類のスキーマにもUIEを導入するのは初めてです。
さらに,UIEのための明示的スキーマインストラクタを備えた再帰的手法であるRexUIEを提案する。
異なるタイプの干渉を避けるため,位置idと注意マスク行列をリセットした。
rexuieはフルショット設定と少数ショット設定の両方で強力なパフォーマンスを示し、複雑なスキーマを抽出するタスクで最先端の結果を得る。
関連論文リスト
- GIELLM: Japanese General Information Extraction Large Language Model
Utilizing Mutual Reinforcement Effect [0.0]
汎用情報抽出大言語モデル(GIELLM)について紹介する。
テキスト分類、感性分析、名前付きエンティティ認識、関係抽出、および一様入力出力スキーマを使用したイベント抽出を統合している。
このイノベーションは、このような多様なIEサブタスクを同時に扱うモデルの最初の例である。
論文 参考訳(メタデータ) (2023-11-12T13:30:38Z) - Universal Information Extraction as Unified Semantic Matching [54.19974454019611]
情報抽出を,異なるタスクやスキーマで共有される構造化と概念化という,2つの能力に分割する。
このパラダイムに基づいて、統一意味マッチングフレームワークを用いて様々なIEタスクを普遍的にモデル化することを提案する。
このように、USMはスキーマと入力テキストを共同でエンコードし、サブ構造を一様に並列に抽出し、必要に応じてターゲット構造を制御できる。
論文 参考訳(メタデータ) (2023-01-09T11:51:31Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Unified Structure Generation for Universal Information Extraction [58.89057387608414]
UIEは、異なるIEタスクを普遍的にモデル化し、ターゲット構造を適応的に生成し、異なる知識ソースから一般的なIE能力を協調的に学習することができる。
実験によると、UIEは4つのIEタスク、13のデータセット、およびすべての教師付き、低リソース、数ショット設定で最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-03-23T08:49:29Z) - Abstractive Query Focused Summarization with Query-Free Resources [60.468323530248945]
本稿では,汎用的な要約リソースのみを利用して抽象的なqfsシステムを構築する問題を考える。
本稿では,要約とクエリのための新しい統一表現からなるMasked ROUGE回帰フレームワークであるMargeを提案する。
最小限の監視から学習したにもかかわらず,遠隔管理環境において最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-12-29T14:39:35Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Lifelong Learning with Searchable Extension Units [21.17631355880764]
本稿では,検索可能拡張ユニット(SEU)という生涯学習フレームワークを提案する。
これは、事前に定義されたオリジナルのモデルの必要性を断ち切り、異なるタスクのための特定の拡張ユニットを検索する。
我々のアプローチは、破滅的な忘れることなく、はるかにコンパクトなモデルを得ることができる。
論文 参考訳(メタデータ) (2020-03-19T03:45:51Z) - Interpretable MTL from Heterogeneous Domains using Boosted Tree [8.095372074268685]
マルチタスク学習(MTL)は,複数のタスクの一般化性能の向上を目的としている。
本稿では,増木理論に倣って,二段階法を提案する。
ベンチマークと実世界のデータセットによる実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2020-03-16T08:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。