論文の概要: Massively Multi-Lingual Event Understanding: Extraction, Visualization,
and Search
- arxiv url: http://arxiv.org/abs/2305.10561v1
- Date: Wed, 17 May 2023 20:41:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-19 18:09:52.658811
- Title: Massively Multi-Lingual Event Understanding: Extraction, Visualization,
and Search
- Title(参考訳): 大規模多言語イベント理解:抽出,可視化,検索
- Authors: Chris Jenkins, Shantanu Agarwal, Joel Barry, Steven Fincke, Elizabeth
Boschee
- Abstract要約: ISI-Clearは最先端のクロスランガル、ゼロショットイベント抽出システムである。
グローバルなイベントをオンデマンドで提供し、100言語でユーザが提供するテキストを処理する。
- 参考スコア(独自算出の注目度): 2.633652471066059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present ISI-Clear, a state-of-the-art, cross-lingual,
zero-shot event extraction system and accompanying user interface for event
visualization & search. Using only English training data, ISI-Clear makes
global events available on-demand, processing user-supplied text in 100
languages ranging from Afrikaans to Yiddish. We provide multiple event-centric
views of extracted events, including both a graphical representation and a
document-level summary. We also integrate existing cross-lingual search
algorithms with event extraction capabilities to provide cross-lingual
event-centric search, allowing English-speaking users to search over events
automatically extracted from a corpus of non-English documents, using either
English natural language queries (e.g. cholera outbreaks in Iran) or structured
queries (e.g. find all events of type Disease-Outbreak with agent cholera and
location Iran).
- Abstract(参考訳): 本稿では,現在最先端,言語横断,ゼロショットイベント抽出システムであるISI-Clearと,イベントの可視化と検索のためのユーザインタフェースについて述べる。
ISI-Clearは英語のトレーニングデータのみを使用して、グローバルイベントをオンデマンドで提供し、AfrikaansからYiddishまで100の言語でユーザが提供するテキストを処理する。
抽出したイベントの複数のイベント中心ビューを,グラフィカルな表現と文書レベルの要約を含む形で提供する。
また、既存の言語横断検索アルゴリズムとイベント抽出機能を統合し、言語横断イベント中心検索を提供し、英語の自然言語クエリ(イランにおけるコレラのアウトブレイクなど)または構造化クエリ(例えば、コレラエージェントとロケーションイランによる病気アウトブレイクのすべてのイベントを見つける)を使用して、英語話者が非英語文書のコーパスから自動的に抽出されたイベントを検索できるようにする。
関連論文リスト
- Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文 参考訳(メタデータ) (2024-10-07T17:59:48Z) - A diverse Multilingual News Headlines Dataset from around the World [57.37355895609648]
Babel Briefingsは、2020年8月から2021年11月までの470万のニュースの見出しを、世界中の30の言語と54の場所にわたって掲載した、新しいデータセットである。
言語モデルのトレーニングや評価のための高品質なデータセットとして機能し、単純でアクセスしやすい記事のコレクションを提供する。
論文 参考訳(メタデータ) (2024-03-28T12:08:39Z) - MUSIED: A Benchmark for Event Detection from Multi-Source Heterogeneous
Informal Texts [7.43647091073357]
イベント検出(ED)は、構造化されていないテキストからイベントトリガーを特定し、分類する。
本稿では,ユーザレビュー,テキスト会話,電話会話に基づく,中国の大規模イベント検出データセットを提案する。
論文 参考訳(メタデータ) (2022-11-25T05:05:29Z) - MEE: A Novel Multilingual Event Extraction Dataset [62.80569691825534]
Event extractは、イベント参照とその引数をテキストから認識することを目的としている。
モデルトレーニングと評価のための高品質な多言語EEデータセットの欠如が主な障害となっている。
本稿では,8言語で50万以上のイベントを参照するアノテーションを提供する新しい多言語イベント抽出データセット(EE)を提案する。
論文 参考訳(メタデータ) (2022-11-11T02:01:41Z) - Zero-Shot On-the-Fly Event Schema Induction [61.91468909200566]
本稿では,大規模な言語モデルを用いて,高レベルなイベント定義,特定のイベント,引数,それらの関係を予測・付与するソースドキュメントを生成する手法を提案する。
我々のモデルを用いて、任意のトピックに関する完全なスキーマを、手動のデータ収集、すなわちゼロショットの方法で、オンザフライで生成することができる。
論文 参考訳(メタデータ) (2022-10-12T14:37:00Z) - Event Extraction: A Survey [3.3758186776249928]
テキストから報告されたイベントを抽出することは、自然言語処理における重要な研究テーマの1つである。
イベント抽出の応用は、ニュースワイヤ、バイオメディカルドメイン、歴史と人類、サイバーセキュリティなど、幅広い領域にまたがる。
本報告では,テキスト文書からの事象検出に関する包括的調査を行う。
論文 参考訳(メタデータ) (2022-10-07T09:36:44Z) - PILED: An Identify-and-Localize Framework for Few-Shot Event Detection [79.66042333016478]
本研究では,事前学習した言語モデルから事象関連知識を引き出すために,クローゼプロンプトを用いた。
型固有のパラメータの数を最小化し、新しい型に対するイベント検出タスクに迅速に適応できるようにします。
論文 参考訳(メタデータ) (2022-02-15T18:01:39Z) - Topic-time Heatmaps for Human-in-the-loop Topic Detection and Tracking [3.7057859167913456]
Topic Detection and Tracking (TDT)は、ニュースメディアのコレクションを、同じ現実世界のイベントに関連するストーリーのクラスタにまとめることを目的としている。
TDTモデルを検索エンジンや発見ツールなどの実用的な応用に適用するには、関心事のコーパスの"イベント"の範囲を絞り込む必要がある。
コーパス全体の視覚的概要を生成し、ユーザーは概要から興味のある領域を選択し、選択した文書が同じイベントに属することを確認(または拒否)するために一連の質問をすることができる。
論文 参考訳(メタデータ) (2021-10-12T19:17:56Z) - Integrating Deep Event-Level and Script-Level Information for Script
Event Prediction [60.67635412135681]
本稿では,MCPredictorと呼ばれるTransformerベースのモデルを提案する。
The experimental results on the wide-useed New York Times corpus showed the effectiveness and superiority of the proposed model。
論文 参考訳(メタデータ) (2021-09-24T07:37:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。