論文の概要: From Dataset Recycling to Multi-Property Extraction and Beyond
- arxiv url: http://arxiv.org/abs/2011.03228v1
- Date: Fri, 6 Nov 2020 08:22:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 05:07:19.319395
- Title: From Dataset Recycling to Multi-Property Extraction and Beyond
- Title(参考訳): データセットのリサイクルから多機能抽出へ
- Authors: Tomasz Dwojak, Micha{\l} Pietruszka, {\L}ukasz Borchmann, Jakub
Ch{\l}\k{e}dowski, Filip Grali\'nski
- Abstract要約: 本稿では,WikiReading Information extractとMachine Readingのデータセット上で,様々なトランスフォーマーアーキテクチャについて検討する。
提案したデュアルソースモデルは,現在の最先端技術よりも大きなマージンで優れている。
WikiReading Recycled - 新たに開発された公開データセットと複数プロパティ抽出の課題を紹介する。
- 参考スコア(独自算出の注目度): 7.670897251425096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates various Transformer architectures on the WikiReading
Information Extraction and Machine Reading Comprehension dataset. The proposed
dual-source model outperforms the current state-of-the-art by a large margin.
Next, we introduce WikiReading Recycled-a newly developed public dataset and
the task of multiple property extraction. It uses the same data as WikiReading
but does not inherit its predecessor's identified disadvantages. In addition,
we provide a human-annotated test set with diagnostic subsets for a detailed
analysis of model performance.
- Abstract(参考訳): 本稿では,wikireading information extraction と machine reading comprehension dataset の様々なトランスフォーマーアーキテクチャについて検討する。
提案したデュアルソースモデルは,最先端技術よりも大きなマージンで優れている。
次に,新しく開発された公開データセットwikireading recycledと複数プロパティ抽出のタスクを紹介する。
WikiReadingと同じデータを使っているが、前任者の特定した欠点を継承していない。
さらに,モデル性能の詳細な解析のために,診断サブセットを備えた人間アノテーションによるテストセットを提供する。
関連論文リスト
- Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - A Computational Analysis of Vagueness in Revisions of Instructional
Texts [2.2577978123177536]
修正前後の命令のペアワイズ版を抽出する。
データ中の2種類の命令を区別するニューラルネットワークの能力について検討する。
論文 参考訳(メタデータ) (2023-09-21T14:26:04Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - HowSumm: A Multi-Document Summarization Dataset Derived from WikiHow
Articles [8.53502615629675]
クエリ中心のマルチドキュメント要約(qMDS)タスクのための,新たな大規模データセットであるHowSummを提案する。
このユースケースは、既存のマルチドキュメント要約(MDS)データセットでカバーされているユースケースと異なり、教育や産業のシナリオに適用できる。
データセットの作成について述べ、他の要約コーパスと区別するユニークな特徴について論じる。
論文 参考訳(メタデータ) (2021-10-07T04:44:32Z) - View Distillation with Unlabeled Data for Extracting Adverse Drug
Effects from User-Generated Data [21.0706831551535]
本稿では,ソーシャルメディアデータ中の逆薬物反応を同定するアルゴリズムを提案する。
本モデルでは,問題の性質と文脈的単語埋め込みの特性に依存している。
我々は、我々のモデルを、利用可能な最大のADRデータセットで評価する。
論文 参考訳(メタデータ) (2021-05-24T15:38:08Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - On the Multi-Property Extraction and Beyond [7.670897251425096]
WikiReading情報抽出と機械読解データセットを用いたDual-source Transformerアーキテクチャについて検討する。
WikiReading Recycled - 新しく開発されたパブリックデータセットで、複数プロパティ抽出のタスクをサポートする。
論文 参考訳(メタデータ) (2020-06-15T11:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。