論文の概要: Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction
- arxiv url: http://arxiv.org/abs/2110.08144v1
- Date: Fri, 15 Oct 2021 15:19:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 12:38:32.846375
- Title: Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction
- Title(参考訳): 多言語オープン情報抽出のための反復予測を用いた多様な抽出経路の統合
- Authors: Bhushan Kotnis, Kiril Gashteovski, Carolin Lawrence, Daniel O\~noro
Rubio, Vanesa Rodriguez-Tembras, Makoto Takamoto, Mathias Niepert
- Abstract要約: 本稿では,三重項の異なる要素に対する抽出条件を条件付け,三重項を反復的に抽出する神経多言語OpenIEシステムを提案する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
- 参考スコア(独自算出の注目度): 11.344977846840747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we investigate a simple hypothesis for the Open Information
Extraction (OpenIE) task, that it may be easier to extract some elements of an
triple if the extraction is conditioned on prior extractions which may be
easier to extract. We successfully exploit this and propose a neural
multilingual OpenIE system that iteratively extracts triples by conditioning
extractions on different elements of the triple leading to a rich set of
extractions. The iterative nature of MiLIE also allows for seamlessly
integrating rule based extraction systems with a neural end-to-end system
leading to improved performance. MiLIE outperforms SOTA systems on multiple
languages ranging from Chinese to Galician thanks to it's ability of combining
multiple extraction pathways. Our analysis confirms that it is indeed true that
certain elements of an extraction are easier to extract than others. Finally,
we introduce OpenIE evaluation datasets for two low resource languages namely
Japanese and Galician.
- Abstract(参考訳): 本稿では,オープン情報抽出(openie)タスクに対する単純な仮説について検討し,抽出がより容易に抽出できる先行抽出について条件づけされた場合,三重項のいくつかの要素の抽出が容易になる可能性について検討する。
これをうまく活用し,三重項の異なる要素の抽出を条件付けして反復的に三重項を抽出する神経多言語openieシステムを提案する。
MiLIEの反復的な性質により、ルールベースの抽出システムをニューラルなエンドツーエンドシステムとシームレスに統合することで、パフォーマンスが向上する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
分析の結果,抽出の特定の要素が他の要素よりも抽出が容易であることが確認された。
最後に,日本語とガリシア語という2つの低資源言語を対象としたOpenIE評価データセットを提案する。
関連論文リスト
- Extracting and Transferring Abilities For Building Multi-lingual Ability-enhanced Large Language Models [104.96990850774566]
我々は,MAETと命名された多言語能力抽出と伝達手法を提案する。
我々のキーとなる考え方は、大きな言語モデルから言語に依存しない能力に関する重みを分解し抽出することである。
実験結果から,MAETは高度能力の抽出と伝達を効果的に行うことができ,トレーニングベースライン法よりも優れることがわかった。
論文 参考訳(メタデータ) (2024-10-10T11:23:18Z) - Improving Recall of Large Language Models: A Model Collaboration Approach for Relational Triple Extraction [44.716502690026026]
長い文から三重項の集合を出力する関係三重抽出は、知識獲得において重要な役割を果たす。
大規模な言語モデルでは、適切な命令が与えられた場合、簡単な文から数ショットの学習や微調整によってトリプルを正確に抽出することができる。
本稿では,大規模言語モデルと小さなモデルを統合した評価フィルタリングフレームワークを設計する。
論文 参考訳(メタデータ) (2024-04-15T09:03:05Z) - Adaptive Ordered Information Extraction with Deep Reinforcement Learning [19.76901412962578]
本稿では、異なるインスタンスに対して最適な要素抽出順序を求めるために、新しい適応順序付きIEパラダイムを提案する。
また,各インスタンスに対して最適な抽出順序を動的に生成するための強化学習に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T08:58:56Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Towards Relation Extraction From Speech [56.36416922396724]
本稿では,新たな聴取情報抽出タスク,すなわち音声関係抽出を提案する。
本研究では,音声合成システムによる音声関係抽出のための訓練データセットを構築し,英語母語話者によるクラウドソーシングによるテストデータセットを構築した。
我々は,音声関係抽出における課題を識別するための包括的実験を行い,今後の探索に光を当てる可能性がある。
論文 参考訳(メタデータ) (2022-10-17T05:53:49Z) - UniREx: A Unified Learning Framework for Language Model Rationale
Extraction [30.39545674859148]
論理抽出のための統一的で柔軟な学習フレームワークUniRExを提案する。
UniRExは、合理的抽出学習プロセスのエンドツーエンドのカスタマイズを可能にする。
最高のUniREx構成は、5つのデシダラタのバランスが良くなります。
論文 参考訳(メタデータ) (2021-12-16T11:39:21Z) - A Simple but Effective Bidirectional Extraction Framework for Relational
Triple Extraction [0.9926500244448218]
近年,タグに基づくリレーショナルトリプル抽出手法が研究の注目を集めている。
これらの手法の多くは、まず全ての対象を抽出し、抽出された対象に基づいて対象と関係を同時に抽出する一方向抽出の枠組みを採っている。
この枠組みには、被験者の抽出結果に敏感すぎるという明らかな欠陥がある。
2つの相補的な方向から抽出されたエンティティペアに基づいて三重項を抽出する双方向抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-09T14:17:33Z) - Contrastive Triple Extraction with Generative Transformer [72.21467482853232]
生成変換器を用いた新しい3重抽出モデルを提案する。
具体的には,エンコーダデコーダをベースとした1つの共有トランスフォーマモジュールを提案する。
忠実な結果を得るために,新しい三重項コントラストトレーニングオブジェクトを提案する。
論文 参考訳(メタデータ) (2020-09-14T05:29:24Z) - IMoJIE: Iterative Memory-Based Joint Open Information Extraction [37.487044478970965]
提案するIMojieはCopyAttentionの拡張であり, 従来抽出した全データに対して次の抽出条件を導出する。
IMoJIEはCopyAttentionを約18F1pt、BERTベースの強力なベースラインを2F1ptで上回る。
論文 参考訳(メタデータ) (2020-05-17T07:04:08Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。