論文の概要: Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction
- arxiv url: http://arxiv.org/abs/2110.08144v1
- Date: Fri, 15 Oct 2021 15:19:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 12:38:32.846375
- Title: Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction
- Title(参考訳): 多言語オープン情報抽出のための反復予測を用いた多様な抽出経路の統合
- Authors: Bhushan Kotnis, Kiril Gashteovski, Carolin Lawrence, Daniel O\~noro
Rubio, Vanesa Rodriguez-Tembras, Makoto Takamoto, Mathias Niepert
- Abstract要約: 本稿では,三重項の異なる要素に対する抽出条件を条件付け,三重項を反復的に抽出する神経多言語OpenIEシステムを提案する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
- 参考スコア(独自算出の注目度): 11.344977846840747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we investigate a simple hypothesis for the Open Information
Extraction (OpenIE) task, that it may be easier to extract some elements of an
triple if the extraction is conditioned on prior extractions which may be
easier to extract. We successfully exploit this and propose a neural
multilingual OpenIE system that iteratively extracts triples by conditioning
extractions on different elements of the triple leading to a rich set of
extractions. The iterative nature of MiLIE also allows for seamlessly
integrating rule based extraction systems with a neural end-to-end system
leading to improved performance. MiLIE outperforms SOTA systems on multiple
languages ranging from Chinese to Galician thanks to it's ability of combining
multiple extraction pathways. Our analysis confirms that it is indeed true that
certain elements of an extraction are easier to extract than others. Finally,
we introduce OpenIE evaluation datasets for two low resource languages namely
Japanese and Galician.
- Abstract(参考訳): 本稿では,オープン情報抽出(openie)タスクに対する単純な仮説について検討し,抽出がより容易に抽出できる先行抽出について条件づけされた場合,三重項のいくつかの要素の抽出が容易になる可能性について検討する。
これをうまく活用し,三重項の異なる要素の抽出を条件付けして反復的に三重項を抽出する神経多言語openieシステムを提案する。
MiLIEの反復的な性質により、ルールベースの抽出システムをニューラルなエンドツーエンドシステムとシームレスに統合することで、パフォーマンスが向上する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
分析の結果,抽出の特定の要素が他の要素よりも抽出が容易であることが確認された。
最後に,日本語とガリシア語という2つの低資源言語を対象としたOpenIE評価データセットを提案する。
関連論文リスト
- SEMQA: Semi-Extractive Multi-Source Question Answering [98.76021956492697]
本稿では,複数ソースを半抽出的に要約することで,複数の質問に答える新しいQAタスクを提案する。
この種の最初のデータセットであるQuoteSumを作成し、自然および生成された質問に対する人間による半抽出的な回答を提示する。
論文 参考訳(メタデータ) (2023-11-08T18:46:32Z) - Adaptive Ordered Information Extraction with Deep Reinforcement Learning [19.76901412962578]
本稿では、異なるインスタンスに対して最適な要素抽出順序を求めるために、新しい適応順序付きIEパラダイムを提案する。
また,各インスタンスに対して最適な抽出順序を動的に生成するための強化学習に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T08:58:56Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Structured information extraction from complex scientific text with
fine-tuned large language models [55.96705756327738]
そこで本研究では,共振器認識と関係抽出のための簡単なシーケンス・ツー・シーケンス手法を提案する。
このアプローチは、約500組のプロンプトで微調整された、事前訓練済みの大規模言語モデル(LLM)であるGPT-3を利用する。
このアプローチは、構造化されていないテキストから抽出された構造化知識の大規模なデータベースを得るための、シンプルで、アクセス可能で、非常に柔軟な経路を示す。
論文 参考訳(メタデータ) (2022-12-10T07:51:52Z) - Towards Relation Extraction From Speech [56.36416922396724]
本稿では,新たな聴取情報抽出タスク,すなわち音声関係抽出を提案する。
本研究では,音声合成システムによる音声関係抽出のための訓練データセットを構築し,英語母語話者によるクラウドソーシングによるテストデータセットを構築した。
我々は,音声関係抽出における課題を識別するための包括的実験を行い,今後の探索に光を当てる可能性がある。
論文 参考訳(メタデータ) (2022-10-17T05:53:49Z) - UniREx: A Unified Learning Framework for Language Model Rationale
Extraction [30.39545674859148]
論理抽出のための統一的で柔軟な学習フレームワークUniRExを提案する。
UniRExは、合理的抽出学習プロセスのエンドツーエンドのカスタマイズを可能にする。
最高のUniREx構成は、5つのデシダラタのバランスが良くなります。
論文 参考訳(メタデータ) (2021-12-16T11:39:21Z) - A Simple but Effective Bidirectional Extraction Framework for Relational
Triple Extraction [0.9926500244448218]
近年,タグに基づくリレーショナルトリプル抽出手法が研究の注目を集めている。
これらの手法の多くは、まず全ての対象を抽出し、抽出された対象に基づいて対象と関係を同時に抽出する一方向抽出の枠組みを採っている。
この枠組みには、被験者の抽出結果に敏感すぎるという明らかな欠陥がある。
2つの相補的な方向から抽出されたエンティティペアに基づいて三重項を抽出する双方向抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-09T14:17:33Z) - An Effective System for Multi-format Information Extraction [1.027461951217988]
2021年の言語とインテリジェンスチャレンジは、異なる次元からの情報抽出を評価するように設計されている。
本稿では,このマルチフォーマット情報抽出コンペティションタスクのシステムについて述べる。
本システムでは,このマルチフォーマット情報抽出作業において,テストセットのリーダボード上で4位にランクインしている。
論文 参考訳(メタデータ) (2021-08-16T08:25:17Z) - Contrastive Triple Extraction with Generative Transformer [72.21467482853232]
生成変換器を用いた新しい3重抽出モデルを提案する。
具体的には,エンコーダデコーダをベースとした1つの共有トランスフォーマモジュールを提案する。
忠実な結果を得るために,新しい三重項コントラストトレーニングオブジェクトを提案する。
論文 参考訳(メタデータ) (2020-09-14T05:29:24Z) - IMoJIE: Iterative Memory-Based Joint Open Information Extraction [37.487044478970965]
提案するIMojieはCopyAttentionの拡張であり, 従来抽出した全データに対して次の抽出条件を導出する。
IMoJIEはCopyAttentionを約18F1pt、BERTベースの強力なベースラインを2F1ptで上回る。
論文 参考訳(メタデータ) (2020-05-17T07:04:08Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。