論文の概要: CEHA: A Dataset of Conflict Events in the Horn of Africa
- arxiv url: http://arxiv.org/abs/2412.13511v1
- Date: Wed, 18 Dec 2024 05:22:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 13:24:51.510551
- Title: CEHA: A Dataset of Conflict Events in the Horn of Africa
- Title(参考訳): CEHA:アフリカの角における紛争のデータセット
- Authors: Rui Bai, Di Lu, Shihao Ran, Elizabeth Olson, Hemank Lamba, Aoife Cahill, Joel Tetreault, Alex Jaimes,
- Abstract要約: 本稿では,アフリカのホーン(CEHA)における新たなベンチマークデータセットであるConflict Eventsを紹介する。
このデータセットは、アフリカのホーン地方における紛争イベントに関する500のイングランドのイベント記述で構成されている。
このデータセットは、人道・平和開発Nexusの利害関係者が要求する特定の領域に応じて、主要な紛争リスクのタイプを分類する。
- 参考スコア(独自算出の注目度): 13.535234664167662
- License:
- Abstract: Natural Language Processing (NLP) of news articles can play an important role in understanding the dynamics and causes of violent conflict. Despite the availability of datasets categorizing various conflict events, the existing labels often do not cover all of the fine-grained violent conflict event types relevant to areas like the Horn of Africa. In this paper, we introduce a new benchmark dataset Conflict Events in the Horn of Africa region (CEHA) and propose a new task for identifying violent conflict events using online resources with this dataset. The dataset consists of 500 English event descriptions regarding conflict events in the Horn of Africa region with fine-grained event-type definitions that emphasize the cause of the conflict. This dataset categorizes the key types of conflict risk according to specific areas required by stakeholders in the Humanitarian-Peace-Development Nexus. Additionally, we conduct extensive experiments on two tasks supported by this dataset: Event-relevance Classification and Event-type Classification. Our baseline models demonstrate the challenging nature of these tasks and the usefulness of our dataset for model evaluations in low-resource settings with limited number of training data.
- Abstract(参考訳): ニュース記事の自然言語処理(NLP)は、暴力的対立のダイナミクスや原因を理解する上で重要な役割を果たす。
さまざまなコンフリクトイベントを分類するデータセットが利用可能であるにもかかわらず、既存のラベルはアフリカのホーンのような地域に関連する、きめ細かい暴力的なコンフリクトイベントのタイプをすべてカバーしていないことが多い。
本稿では,アフリカのホーン地域(CEHA)における新たなベンチマークデータセットであるConflict Eventsを導入し,このデータセットを用いたオンラインリソースを用いた暴力的紛争イベントの識別のための新しいタスクを提案する。
このデータセットは、アフリカのホーン地方における紛争に関する500のイングランドのイベント記述と、紛争の原因を強調する詳細なイベントタイプ定義で構成されている。
このデータセットは、人道・平和開発Nexusの利害関係者が要求する特定の領域に応じて、主要な紛争リスクのタイプを分類する。
さらに、このデータセットがサポートする2つのタスクについて、イベント関連分類とイベントタイプ分類という広範な実験を行う。
我々のベースラインモデルは、これらのタスクの難易度と、限られたトレーニングデータ数を持つ低リソース環境におけるモデル評価のためのデータセットの有用性を実証する。
関連論文リスト
- MAVEN-Fact: A Large-scale Event Factuality Detection Dataset [55.01875707021496]
我々は,MAVENデータセットに基づく大規模かつ高品質なEFDデータセットであるMAVEN-Factを紹介する。
MAVEN-Factには112,276のイベントのファクトリティアノテーションが含まれており、EFDデータセットとしては最大である。
MAVEN-Factは従来の微調整モデルと大規模言語モデル(LLM)の両方において困難であることを示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-07-22T03:43:46Z) - Type-aware Decoding via Explicitly Aggregating Event Information for
Document-level Event Extraction [11.432496741340334]
ドキュメントレベルのイベント抽出は2つの大きな課題に直面している。
本稿では,これらの制約に対処する新規な Explicitly Aggregating(SEA) モデルを提案する。
SEAはイベント情報をイベントタイプとロール表現に集約し、特定の型認識表現に基づいてイベントレコードのデコードを可能にする。
論文 参考訳(メタデータ) (2023-10-16T15:10:42Z) - Getting Sick After Seeing a Doctor? Diagnosing and Mitigating Knowledge Conflicts in Event Temporal Reasoning [87.92209048521153]
出来事の時間的推論は、物語から2つ以上の出来事の間の時間的関係を特定することを目的としている。
知識の衝突は、コンテキスト内の事象の実際の時間的関係と、モデルによって学習された事前の知識やバイアスとの間にミスマッチがあるときに起こる。
論文 参考訳(メタデータ) (2023-05-24T10:04:06Z) - Understanding the Impact of Competing Events on Heterogeneous Treatment
Effect Estimation from Time-to-Event Data [92.51773744318119]
本研究では,競合イベントの存在下での時間-時間データからヘテロジニアス処理効果(HTE)を推定する問題について検討する。
提案手法は,HTEを推定するための結果モデリング手法であり,既存の時間-時間データの予測モデルを,将来的な結果のプラグイン推定手段としてどのように利用できるかを検討する。
HTEの推定に汎用的な機械学習予測モデルを使用する場合、これらの課題がいつどのように機能するかを理論的に分析し、実証的に説明する。
論文 参考訳(メタデータ) (2023-02-23T14:28:55Z) - A method for incremental discovery of financial event types based on
anomaly detection [7.035546119642223]
金融ドメイン内のイベントデータセットは、しばしば実際のアプリケーションシナリオに基づいて構築されます。
新しい金融ビッグデータは、特定のシナリオで定義されたイベントタイプに制限されない。
イベントタイプの漸進的な発見を実現するために、3段階のアプローチが提案されている。
論文 参考訳(メタデータ) (2023-02-16T10:37:19Z) - An Ordinal Latent Variable Model of Conflict Intensity [59.49424978353101]
ゴールドスタインスケール(Goldstein scale)は、紛争・協力的なスケールでイベントをスコアする、広く使われている専門家ベースの尺度である。
本稿では、競合強度を測定するために、潜伏変数に基づくアプローチをとる。
論文 参考訳(メタデータ) (2022-10-08T08:59:17Z) - EA$^2$E: Improving Consistency with Event Awareness for Document-Level
Argument Extraction [52.43978926985928]
本稿では、トレーニングと推論のための拡張コンテキストを備えたイベント・アウェア・引数抽出(EA$2$E)モデルを紹介する。
WIKIEVENTSとACE2005データセットの実験結果から,EA$2$Eの有効性が示された。
論文 参考訳(メタデータ) (2022-05-30T04:33:51Z) - COfEE: A Comprehensive Ontology for Event Extraction from text, with an
online annotation tool [3.8995911009078816]
イベント抽出(EE)は、特定のインシデントとそのアクターに関する情報をテキストから導き出そうとする。
EEは知識ベースの構築、情報検索、要約、オンライン監視システムなど、多くの領域で有用である。
COfEEは、環境問題、サイバースペース、犯罪活動、自然災害に関連する新しいカテゴリを含む2つの階層レベル(イベントタイプとイベントサブタイプ)から構成されている。
論文 参考訳(メタデータ) (2021-07-21T19:43:22Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。