Fugu-MT 論文翻訳(概要): GLEN: General-Purpose Event Detection for Thousands of Types

論文の概要: GLEN: General-Purpose Event Detection for Thousands of Types

arxiv url: http://arxiv.org/abs/2303.09093v3
Date: Tue, 31 Oct 2023 17:21:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-02 03:44:59.173533
Title: GLEN: General-Purpose Event Detection for Thousands of Types
Title（参考訳）: GLEN:数千の型に対する汎用イベント検出
Authors: Qiusi Zhan, Sha Li, Kathryn Conger, Martha Palmer, Heng Ji, Jiawei Han
Abstract要約: 汎用的なイベント検出データセットGLENを構築し、205Kイベントの参照を3,465種類の異なるタイプでカバーしています。 GLENはオントロジーにおいて、今日の最大のイベントデータセットよりも20倍大きい。また,GLENの大規模化に特化して設計された多段階イベント検出モデルCEDARを提案する。
参考スコア（独自算出の注目度）: 80.99866527772512
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: The progress of event extraction research has been hindered by the absence of wide-coverage, large-scale datasets. To make event extraction systems more accessible, we build a general-purpose event detection dataset GLEN, which covers 205K event mentions with 3,465 different types, making it more than 20x larger in ontology than today's largest event dataset. GLEN is created by utilizing the DWD Overlay, which provides a mapping between Wikidata Qnodes and PropBank rolesets. This enables us to use the abundant existing annotation for PropBank as distant supervision. In addition, we also propose a new multi-stage event detection model CEDAR specifically designed to handle the large ontology size in GLEN. We show that our model exhibits superior performance compared to a range of baselines including InstructGPT. Finally, we perform error analysis and show that label noise is still the largest challenge for improving performance for this new dataset. Our dataset, code, and models are released at \url{https://github.com/ZQS1943/GLEN}.}
Abstract（参考訳）: イベント抽出研究の進展は、広範囲の大規模データセットがないために妨げられている。イベント抽出システムをより使いやすくするために、汎用のイベント検出データセットglenを構築し、これは205kのイベント参照を3,465の異なる型でカバーし、現在の最大のイベントデータセットよりもオントロジーで20倍以上大きいものにします。 GLENはDWD Overlayを利用して作成され、Wikidata QnodesとPropBankのロールセット間のマッピングを提供する。これにより、PropBankの豊富なアノテーションを遠隔監視として利用することができます。さらに,GLENの大きなオントロジーサイズを扱うために設計された,多段階イベント検出モデルCEDARを提案する。本モデルはinstructgptを含む各種ベースラインと比較して優れた性能を示す。最後に、エラー解析を行い、新しいデータセットのパフォーマンスを改善する上で、ラベルノイズが依然として最大の課題であることを示す。我々のデータセット、コード、モデルは \url{https://github.com/ZQS 1943/GLEN} でリリースされます。 }

関連論文リスト

Plain-Det: A Plain Multi-Dataset Object Detector [22.848784430833835]
Plain-Detは、新しいデータセットに対応する柔軟性、さまざまなデータセットのパフォーマンス、トレーニング効率を提供する。 13の下流データセットに対して広範な実験を行い、Plain-Detは強力な一般化能力を示す。
論文参考訳（メタデータ） (2024-07-14T05:18:06Z)
DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。 DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文参考訳（メタデータ） (2024-07-06T15:25:10Z)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳（メタデータ） (2024-03-11T09:20:40Z)
Long-term Frame-Event Visual Tracking: Benchmark Dataset and Baseline [37.06330707742272]
まず, FELTと呼ばれる, 長期的かつ大規模な単一オブジェクト追跡データセットを提案する。 742の動画と1,594,474のRGBフレームとイベントストリームペアが含まれており、これまでで最大のフレームイベント追跡データセットになっている。本稿では,RGBとイベントデータの両方を融合させるために,現代的なホップフィールド層をマルチヘッド自己アテンションブロックに導入することで,統一バックボーンとして新しい連想メモリトランスフォーマーネットワークを提案する。
論文参考訳（メタデータ） (2024-03-09T08:49:50Z)
Improving Event Definition Following For Zero-Shot Event Detection [66.27883872707523]
ゼロショットイベント検出に対する既存のアプローチは通常、既知のイベントタイプをアノテートしたデータセット上でモデルをトレーニングする。イベント定義に従うためのトレーニングモデルによるゼロショットイベント検出の改善を目指しています。
論文参考訳（メタデータ） (2024-03-05T01:46:50Z)
MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6065882758648]
MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。 EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文参考訳（メタデータ） (2023-11-15T16:52:14Z)
Event Stream-based Visual Object Tracking: A High-Resolution Benchmark Dataset and A Novel Baseline [38.42400442371156]
既存の作業は、整列したRGBとイベントデータを使用して正確なトラッキングを行うか、イベントベースのトラッカーを直接学習する。本稿では,知識伝達を促進するために,学習中に多モード/多ビュー情報を十分に活用できる新しい階層型知識蒸留フレームワークを提案する。 EventVOTという,最初の大規模高解像度(1280×720$)のデータセットを提案する。1141のビデオが収録されており,歩行者や自動車,UAV,ピンポンなど,幅広いカテゴリをカバーする。
論文参考訳（メタデータ） (2023-09-26T01:42:26Z)
BigDetection: A Large-scale Benchmark for Improved Object Detector Pre-training [44.32782190757813]
我々はBigDetectionと呼ばれる新しい大規模ベンチマークを構築した。私たちのデータセットには600のオブジェクトカテゴリがあり、3.4M以上のトレーニングイメージと36Mのバウンディングボックスが含まれています。
論文参考訳（メタデータ） (2022-03-24T17:57:29Z)
Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker [23.990907956996413]
文書レベルのイベント抽出は、記事全体からイベント情報を認識することを目的としている。この2つの課題のために既存の手法は有効ではない。トラッカーを用いた異種グラフベースインタラクションモデルを提案する。
論文参考訳（メタデータ） (2021-05-31T12:45:03Z)
Open Graph Benchmark: Datasets for Machine Learning on Graphs [86.96887552203479]
スケーラブルで堅牢で再現可能なグラフ機械学習(ML)の研究を容易にするために,Open Graph Benchmark(OGB)を提案する。 OGBデータセットは大規模で、複数の重要なグラフMLタスクを含み、さまざまなドメインをカバーする。各データセットに対して,有意義なアプリケーション固有のデータ分割と評価指標を用いた統一評価プロトコルを提供する。
論文参考訳（メタデータ） (2020-05-02T03:09:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。