論文の概要: ArgFuse: A Weakly-Supervised Framework for Document-Level Event Argument
Aggregation
- arxiv url: http://arxiv.org/abs/2106.10862v1
- Date: Mon, 21 Jun 2021 05:21:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 01:05:32.399955
- Title: ArgFuse: A Weakly-Supervised Framework for Document-Level Event Argument
Aggregation
- Title(参考訳): argfuse:ドキュメントレベルのイベント引数集約のための弱い教師付きフレームワーク
- Authors: Debanjana Kar, Sudeshna Sarkar, Pawan Goyal
- Abstract要約: 情報集約(Information Aggregation)やArgument Aggregation(Argument Aggregation)というタスクを導入する。
我々の目的は、文レベルで抽出された無関係で冗長な引数の言及をフィルタリングし、文書レベルの情報フレームを描画することである。
低リソース環境下で効率的に動作するために,能動的学習戦略を採用する複数のシーブを持つ抽出アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 9.56216681584111
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Most of the existing information extraction frameworks (Wadden et al., 2019;
Veysehet al., 2020) focus on sentence-level tasks and are hardly able to
capture the consolidated information from a given document. In our endeavour to
generate precise document-level information frames from lengthy textual
records, we introduce the task of Information Aggregation or Argument
Aggregation. More specifically, our aim is to filter irrelevant and redundant
argument mentions that were extracted at a sentence level and render a document
level information frame. Majority of the existing works have been observed to
resolve related tasks of document-level event argument extraction (Yang et al.,
2018a; Zheng et al., 2019a) and salient entity identification (Jain et
al.,2020) using supervised techniques. To remove dependency from large amounts
of labelled data, we explore the task of information aggregation using
weakly-supervised techniques. In particular, we present an extractive algorithm
with multiple sieves which adopts active learning strategies to work
efficiently in low-resource settings. For this task, we have annotated our own
test dataset comprising of 131 document information frames and have released
the code and dataset to further research prospects in this new domain. To the
best of our knowledge, we are the first to establish baseline results for this
task in English. Our data and code are publicly available at
https://github.com/DebanjanaKar/ArgFuse.
- Abstract(参考訳): 既存の情報抽出フレームワーク(Wadden et al., 2019; Veysehet al., 2020)のほとんどは文レベルのタスクに重点を置いており、ある文書から統合された情報を取得できない。
長文記録から正確な文書レベルの情報フレームを生成するために,情報集約や引数集約というタスクを導入する。
具体的には、文レベルで抽出された無関係で冗長な引数の言及をフィルタリングし、文書レベルの情報フレームを描画する。
既存の研究の大部分は、文書レベルのイベント引数抽出(Yang et al., 2018a; Zheng et al., 2019a)と、教師付き手法を用いた有能な実体識別(Jain et al., 2020)の関連課題を解決するために観察されている。
大量のラベル付きデータからの依存性を取り除くために,弱い教師付き手法を用いて情報集約のタスクを探索する。
特に,マルチシーブを用いた抽出アルゴリズムを提案する。これは低リソース環境で効率的に働くために,アクティブな学習戦略を採用している。
このタスクのために、我々は131のドキュメント情報フレームからなる独自のテストデータセットを注釈付けし、新しいドメインのさらなる研究のためにコードとデータセットをリリースした。
私たちの知る限りでは、このタスクのベースラインとなる結果を英語で最初に確立しました。
私たちのデータとコードはhttps://github.com/DebanjanaKar/ArgFuse.comで公開されています。
関連論文リスト
- GraphKD: Exploring Knowledge Distillation Towards Document Object
Detection with Structured Graph Creation [14.511401955827875]
ドキュメントにおけるオブジェクト検出は、構造的要素の識別プロセスを自動化するための重要なステップである。
文書画像中の文書オブジェクトを正しく識別し,ローカライズするための,グラフベースの知識蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-17T23:08:32Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Knowledge Combination to Learn Rotated Detection Without Rotated
Annotation [53.439096583978504]
回転バウンディングボックスは、伸長したオブジェクトの出力あいまいさを劇的に減少させる。
この効果にもかかわらず、回転検出器は広く使われていない。
本稿では,モデルが正確な回転ボックスを予測できるフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-05T03:07:36Z) - Dynamic Global Memory for Document-level Argument Extraction [63.314514124716936]
文書レベルのイベント引数抽出のための,新しいグローバルなニューラルジェネレーションベースのフレームワークを提案する。
文書メモリストアを使用してコンテキストイベント情報を記録し、それを暗黙的に明示的に活用することで、後のイベントの引数の復号に役立ちます。
実験結果から,我々のフレームワークは従来の手法よりも大幅に優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-18T23:45:25Z) - OPAD: An Optimized Policy-based Active Learning Framework for Document
Content Analysis [6.159771892460152]
文書のコンテンツ検出タスクにおける能動的学習のための強化ポリシーを用いた新しいフレームワークであるtextitOPADを提案する。
フレームワークは、取得機能を学び、パフォーマンスメトリクスを最適化しながら、選択するサンプルを決定する。
本稿では,文書理解に関わる様々なタスクに対する能動的学習のためのテキストOPADフレームワークの優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-01T07:40:56Z) - WSL-DS: Weakly Supervised Learning with Distant Supervision for Query
Focused Multi-Document Abstractive Summarization [16.048329028104643]
Query Focused Multi-Document Summarization (QF-MDS)タスクでは、ドキュメントのセットとクエリが与えられ、そこでこれらのドキュメントから要約を生成する。
このタスクの大きな課題のひとつは、ラベル付きトレーニングデータセットの可用性の欠如である。
本稿では,遠隔指導による弱教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T02:02:55Z) - SciREX: A Challenge Dataset for Document-Level Information Extraction [56.83748634747753]
ドキュメントレベルで大規模な情報抽出データセットを作成するのは難しい。
複数のIEタスクを含む文書レベルのIEデータセットであるSciREXを紹介する。
我々は、従来の最先端のIEモデルをドキュメントレベルのIEに拡張する強力なベースラインとして、ニューラルモデルを開発する。
論文 参考訳(メタデータ) (2020-05-01T17:30:10Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。