論文の概要: CompactIE: Compact Facts in Open Information Extraction
- arxiv url: http://arxiv.org/abs/2205.02880v1
- Date: Thu, 5 May 2022 18:27:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 13:12:11.348317
- Title: CompactIE: Compact Facts in Open Information Extraction
- Title(参考訳): CompactIE:オープン情報抽出におけるコンパクト要素
- Authors: Farima Fatahi Bayat, Nikita Bhutani, H.V. Jagadish
- Abstract要約: 現代のニューラルOpenIEシステムの大きな欠点は、成分のコンパクト性よりも抽出における情報の高いカバレッジを優先することである。
重なり合う成分を持つコンパクトな抽出を生成するために,新しいパイプライン方式を用いたOpenIEシステムであるCompactIEを提案する。
CaRBとWire57のデータセットの実験は、CompactIEが従来のシステムよりも1.5x-2倍コンパクトな抽出を高精度で発見していることを示している。
- 参考スコア(独自算出の注目度): 21.690791292700464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A major drawback of modern neural OpenIE systems and benchmarks is that they
prioritize high coverage of information in extractions over compactness of
their constituents. This severely limits the usefulness of OpenIE extractions
in many downstream tasks. The utility of extractions can be improved if
extractions are compact and share constituents. To this end, we study the
problem of identifying compact extractions with neural-based methods. We
propose CompactIE, an OpenIE system that uses a novel pipelined approach to
produce compact extractions with overlapping constituents. It first detects
constituents of the extractions and then links them to build extractions. We
train our system on compact extractions obtained by processing existing
benchmarks. Our experiments on CaRB and Wire57 datasets indicate that CompactIE
finds 1.5x-2x more compact extractions than previous systems, with high
precision, establishing a new state-of-the-art performance in OpenIE.
- Abstract(参考訳): 現代のニューラルOpenIEシステムとベンチマークの大きな欠点は、成分のコンパクトさよりも抽出における情報の高いカバレッジを優先することである。
これにより、多くの下流タスクにおけるOpenIE抽出の有用性が著しく制限される。
抽出がコンパクトで共有成分であれば、抽出の有用性が向上する。
そこで本研究では,ニューラルベース手法を用いて,コンパクト抽出を識別する問題について検討する。
重なり合う成分を持つコンパクトな抽出を生成するために,新しいパイプライン方式を用いたOpenIEシステムであるCompactIEを提案する。
最初に抽出の成分を検出し、それからそれらをリンクして抽出を構築する。
我々は既存のベンチマークを処理して得られたコンパクトな抽出を学習する。
CRBおよびWire57データセットを用いた実験により,CompactIEは従来のシステムよりも1.5x-2倍コンパクトに抽出できることがわかった。
関連論文リスト
- MinerU: An Open-Source Solution for Precise Document Content Extraction [63.00490552013759]
MinerUは、高精度な文書コンテンツ抽出のためのオープンソースのソリューションである。
我々は、MinerUが、様々なドキュメントタイプで一貫してハイパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-09-27T15:35:15Z) - TSTEM: A Cognitive Platform for Collecting Cyber Threat Intelligence in the Wild [0.06597195879147556]
オープンソースからサイバー脅威情報(CTI)を抽出することは、急速に拡大する防衛戦略である。
従来の研究では、抽出プロセスの個々のコンポーネントの改善に焦点が当てられていた。
コミュニティには、ストリーミングCTIデータパイプラインを野放しに展開するオープンソースプラットフォームがない。
論文 参考訳(メタデータ) (2024-02-15T14:29:21Z) - Adaptive Ordered Information Extraction with Deep Reinforcement Learning [19.76901412962578]
本稿では、異なるインスタンスに対して最適な要素抽出順序を求めるために、新しい適応順序付きIEパラダイムを提案する。
また,各インスタンスに対して最適な抽出順序を動的に生成するための強化学習に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T08:58:56Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Towards Relation Extraction From Speech [56.36416922396724]
本稿では,新たな聴取情報抽出タスク,すなわち音声関係抽出を提案する。
本研究では,音声合成システムによる音声関係抽出のための訓練データセットを構築し,英語母語話者によるクラウドソーシングによるテストデータセットを構築した。
我々は,音声関係抽出における課題を識別するための包括的実験を行い,今後の探索に光を当てる可能性がある。
論文 参考訳(メタデータ) (2022-10-17T05:53:49Z) - Sample-Efficient Reinforcement Learning in the Presence of Exogenous
Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。
本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。
内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文 参考訳(メタデータ) (2022-06-09T05:19:32Z) - A Simple but Effective Bidirectional Extraction Framework for Relational
Triple Extraction [0.9926500244448218]
近年,タグに基づくリレーショナルトリプル抽出手法が研究の注目を集めている。
これらの手法の多くは、まず全ての対象を抽出し、抽出された対象に基づいて対象と関係を同時に抽出する一方向抽出の枠組みを採っている。
この枠組みには、被験者の抽出結果に敏感すぎるという明らかな欠陥がある。
2つの相補的な方向から抽出されたエンティティペアに基づいて三重項を抽出する双方向抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-09T14:17:33Z) - Integrating diverse extraction pathways using iterative predictions for
Multilingual Open Information Extraction [11.344977846840747]
本稿では,三重項の異なる要素に対する抽出条件を条件付け,三重項を反復的に抽出する神経多言語OpenIEシステムを提案する。
MiLIEは、複数の抽出経路を組み合わせる能力のおかげで、中国語からガリシア語まで多言語でSOTAシステムより優れている。
論文 参考訳(メタデータ) (2021-10-15T15:19:11Z) - A novel Region of Interest Extraction Layer for Instance Segmentation [3.5493798890908104]
本稿では,既存のRoI抽出器の限界を克服する必要性を動機とする。
提案するレイヤ(Generic RoI Extractor - GRoIE)には,非ローカルなビルディングブロックとアテンション機構が導入され,パフォーマンスが向上する。
GRoIEは、オブジェクト検出とインスタンスセグメンテーションの両方のために、すべての2段階アーキテクチャとシームレスに統合できる。
論文 参考訳(メタデータ) (2020-04-28T17:07:32Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z) - Searching Central Difference Convolutional Networks for Face
Anti-Spoofing [68.77468465774267]
顔認識システムにおいて、顔の反偽造(FAS)が重要な役割を担っている。
最先端のFASメソッドの多くは、スタック化された畳み込みと専門家が設計したネットワークに依存している。
ここでは、中央差分畳み込み(CDC)に基づくフレームレベルの新しいFAS手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T12:48:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。