論文の概要: Towards Generalized Open Information Extraction
- arxiv url: http://arxiv.org/abs/2211.15987v1
- Date: Tue, 29 Nov 2022 07:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:05:00.803412
- Title: Towards Generalized Open Information Extraction
- Title(参考訳): 汎用オープン情報抽出に向けて
- Authors: Bowen Yu, Zhenyu Zhang, Jingyang Li, Haiyang Yu, Tingwen Liu, Jian
Sun, Yongbin Li, Bin Wang
- Abstract要約: 我々は、ソーストレーニングドメインと異なるデータ分布を持つ未確認対象ドメインを一般化する、より現実的なシナリオを提案する。
DragonIEは、ドメイン内設定とドメイン外設定の両方で、F1スコアの6.4%を絶対的に上回っている。
- 参考スコア(独自算出の注目度): 74.20080376460947
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open Information Extraction (OpenIE) facilitates the open-domain discovery of
textual facts. However, the prevailing solutions evaluate OpenIE models on
in-domain test sets aside from the training corpus, which certainly violates
the initial task principle of domain-independence. In this paper, we propose to
advance OpenIE towards a more realistic scenario: generalizing over unseen
target domains with different data distributions from the source training
domains, termed Generalized OpenIE. For this purpose, we first introduce GLOBE,
a large-scale human-annotated multi-domain OpenIE benchmark, to examine the
robustness of recent OpenIE models to domain shifts, and the relative
performance degradation of up to 70% implies the challenges of generalized
OpenIE. Then, we propose DragonIE, which explores a minimalist graph expression
of textual fact: directed acyclic graph, to improve the OpenIE generalization.
Extensive experiments demonstrate that DragonIE beats the previous methods in
both in-domain and out-of-domain settings by as much as 6.0% in F1 score
absolutely, but there is still ample room for improvement.
- Abstract(参考訳): オープン情報抽出(OpenIE)は、テキスト事実のオープンドメイン発見を容易にする。
しかし、一般的なソリューションは、トレーニングコーパスとは別に、ドメイン内テストセット上でOpenIEモデルを評価する。
本稿では,より現実的なシナリオ,すなわち,ソーストレーニング領域と異なるデータ分布を持つ未確認対象領域を一般化する,一般化されたOpenIEを提案する。
この目的のために,我々はまず,最近のOpenIEモデルのドメインシフトに対する堅牢性を検討するために,大規模な人手によるマルチドメインOpenIEベンチマークであるGLOBEを紹介した。
次に,テキスト事実の最小限のグラフ表現である有向非巡回グラフを探索して,OpenIEの一般化を改善するDragonIEを提案する。
大規模な実験では、DragonIEはドメイン内設定とドメイン外設定の両方で、F1スコアの6.0%を絶対上回っているが、改善の余地は十分にある。
関連論文リスト
- Feature-Space Semantic Invariance: Enhanced OOD Detection for Open-Set Domain Generalization [10.38552112657656]
本稿では、FSI(Feature-space Semantic Invariance)を導入して、オープンセット領域の一般化のための統一的なフレームワークを提案する。
FSIは機能領域内の異なるドメイン間のセマンティック一貫性を維持しており、見えないドメイン内のOODインスタンスをより正確に検出することができる。
また、新しいドメインスタイルやクラスラベルで合成データを生成するために生成モデルを採用し、モデルロバスト性を高めます。
論文 参考訳(メタデータ) (2024-11-11T21:51:45Z) - A Survey on Open Information Extraction from Rule-based Model to Large Language Model [29.017823043117144]
オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。
本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。
この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
論文 参考訳(メタデータ) (2022-08-18T08:03:45Z) - A Survey on Neural Open Information Extraction: Current Status and
Future Directions [87.30702606041407]
Open Information extract (OpenIE) は、大規模コーパスからの関係事実のドメインに依存しない発見を容易にする。
我々は、最先端のニューラルなOpenIEモデル、その設計決定、強み、弱点について概観する。
論文 参考訳(メタデータ) (2022-05-24T02:24:55Z) - Challenges for Open-domain Targeted Sentiment Analysis [21.61943346030794]
そこで本研究では、6,013個の人間ラベル付きデータからなる新しいデータセットを提案する。
また、文書中の完全な感情情報を抽出するためのネストされたターゲットアノテーションスキーマも提供します。
論文 参考訳(メタデータ) (2022-04-14T11:44:02Z) - META: Mimicking Embedding via oThers' Aggregation for Generalizable
Person Re-identification [68.39849081353704]
Domain Generalizable (DG) Person Re-identification (ReID)は、トレーニング時に対象のドメインデータにアクセスすることなく、見えないドメインをまたいでテストすることを目的としている。
本稿では,DG ReID のための OThers' Aggregation (META) を用いた Mimicking Embedding という新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T08:06:50Z) - OpenGAN: Open-Set Recognition via Open Data Generation [76.00714592984552]
実世界の機械学習システムは、トレーニングデータとは異なる新しいテストデータを分析する必要がある。
オープンセット識別のための概念的にエレガントな2つのアイデアは、1) オープンvs閉鎖二元判別器を識別的に学習し、2) GAN を用いてクローズドセットデータ分布を教師なし学習する。
OpenGANは、それぞれのアプローチの限界をいくつかの技術的な洞察と組み合わせて解決します。
論文 参考訳(メタデータ) (2021-04-07T06:19:24Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - OpenIE6: Iterative Grid Labeling and Coordination Analysis for Open
Information Extraction [36.439047786561396]
我々は,OpenIEの新たな技術状態を確立しつつ,10倍高速に抽出する反復ラベリングシステムを提案する。
これは、OpenIEを2Dグリッドラベリングタスクとして扱うIGL(Iterative Grid Labeling)アーキテクチャによって実現される。
当社のOpenIEシステムであるOpenIE6は、F1で4 ptsの速さで以前のシステムを打ち負かしています。
論文 参考訳(メタデータ) (2020-10-07T04:05:37Z) - Mind the Gap: Enlarging the Domain Gap in Open Set Domain Adaptation [65.38975706997088]
オープンセットドメイン適応(OSDA)は、ターゲットドメインに未知のクラスが存在することを前提としている。
既存の最先端手法は、より大きなドメインギャップが存在する場合、かなりの性能低下を被ることを示す。
我々は、より大きなドメインギャップに特に対処するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-08T14:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。