論文の概要: Extracting Victim Counts from Text
- arxiv url: http://arxiv.org/abs/2302.12367v1
- Date: Thu, 23 Feb 2023 23:50:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 14:59:25.946112
- Title: Extracting Victim Counts from Text
- Title(参考訳): テキストからVictim Countを抽出する
- Authors: Mian Zhong, Shehzaad Dhuliawala, Niklas Stoehr
- Abstract要約: 人道的セクターの意思決定者は危機時のタイムリーかつ正確な情報に頼っている。
地震で民間人が何人負傷したかを知ることは、適切な援助を割り当てるのに不可欠である。
数字は異なるフォーマットを持ち、数値推論を必要とする可能性がある。
- 参考スコア(独自算出の注目度): 5.478764356647437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decision-makers in the humanitarian sector rely on timely and exact
information during crisis events. Knowing how many civilians were injured
during an earthquake is vital to allocate aids properly. Information about such
victim counts is often only available within full-text event descriptions from
newspapers and other reports. Extracting numbers from text is challenging:
numbers have different formats and may require numeric reasoning. This renders
purely string matching-based approaches insufficient. As a consequence,
fine-grained counts of injured, displaced, or abused victims beyond fatalities
are often not extracted and remain unseen. We cast victim count extraction as a
question answering (QA) task with a regression or classification objective. We
compare regex, dependency parsing, semantic role labeling-based approaches, and
advanced text-to-text models. Beyond model accuracy, we analyze extraction
reliability and robustness which are key for this sensitive task. In
particular, we discuss model calibration and investigate few-shot and
out-of-distribution performance. Ultimately, we make a comprehensive
recommendation on which model to select for different desiderata and data
domains. Our work is among the first to apply numeracy-focused large language
models in a real-world use case with a positive impact.
- Abstract(参考訳): 人道的セクターの意思決定者は危機時のタイムリーかつ正確な情報に頼っている。
地震で民間人が何人負傷したかを知ることは、適切な援助を割り当てるのに不可欠である。
このような犠牲者数に関する情報は、新聞や他の報道からのフルテキストのイベント記述でのみ利用可能である。
数字は異なるフォーマットを持ち、数値推論を必要とする可能性がある。
これにより、純粋に文字列マッチングベースのアプローチが不十分になる。
その結果、犠牲者以外の負傷者、転居者、または虐待された犠牲者の細かな数値は、しばしば抽出されず、目立たないままである。
我々は,質問応答(QA)タスクとして,回帰的,分類的目的を持った被害者数抽出を行った。
regex,dependency parse,semantic role labeling-based approach,advanced text-to-text modelを比較した。
モデル精度を超えて、このセンシティブなタスクの鍵となる抽出信頼性と堅牢性を解析する。
特に,モデルキャリブレーションについて考察し,少数ショットとアウト・オブ・ディストリビューション性能について検討する。
最終的に、異なるデシラタとデータドメインを選択するモデルについて包括的に推奨する。
私たちの研究は、実世界のユースケースに数値に焦点をあてた大規模言語モデルを適用した最初のもののひとつです。
関連論文リスト
- The Empirical Impact of Data Sanitization on Language Models [1.1359551336076306]
本稿では,複数のベンチマーク言語モデリングタスクにおけるデータ・サニタイズの効果を実証的に分析する。
以上の結果から,感情分析やエンテーメントなどのタスクでは,リアクションの影響は極めて低く,典型的には1~5%程度であることが示唆された。
理解的なQ&Aのようなタスクでは、オリジナルのものと比較して、再実行クエリで観測されるパフォーマンスの25%が大幅に低下している。
論文 参考訳(メタデータ) (2024-11-08T21:22:37Z) - MENSA: A Multi-Event Network for Survival Analysis under Informative Censoring [4.0913802846346625]
マルチイベントサバイバル分析のための新しい深層学習手法であるMENSAを紹介する。
筋萎縮性側索硬化症(ALS)患者の身体機能低下までの時間予測の問題点を考察する。
提案手法はL1-Margin損失が278.8日であるのに対し,各イベントを別々にモデル化する場合は355.2日である。
論文 参考訳(メタデータ) (2024-09-10T14:02:34Z) - Navigating the OverKill in Large Language Models [84.62340510027042]
モデルがどのように処理し,クエリの安全性を判断するかを検討することで,過剰スキルの要因について検討する。
以上の結果から,モデル内にショートカットが存在することが明らかとなり,"キル"のような有害な単語が過剰に認識され,安全性が強調され,過度なスキルが増すことが示唆された。
我々は、この現象を緩和するために、トレーニングフリーでモデルに依存しないセルフコントラストデコーディング(Self-Contrastive Decoding、CD)を導入する。
論文 参考訳(メタデータ) (2024-01-31T07:26:47Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - AES Systems Are Both Overstable And Oversensitive: Explaining Why And
Proposing Defenses [66.49753193098356]
スコアリングモデルの驚くべき逆方向の脆さの原因について検討する。
のモデルとして訓練されているにもかかわらず、単語の袋のように振る舞うことを示唆している。
高い精度で試料を発生させる過敏性と過敏性を検出できる検出ベース保護モデルを提案する。
論文 参考訳(メタデータ) (2021-09-24T03:49:38Z) - Narrative Incoherence Detection [76.43894977558811]
本稿では,文間セマンティック理解のための新たなアリーナとして,物語不整合検出の課題を提案する。
複数文の物語を考えると、物語の流れに意味的な矛盾があるかどうかを決定します。
論文 参考訳(メタデータ) (2020-12-21T07:18:08Z) - Probing and Fine-tuning Reading Comprehension Models for Few-shot Event
Extraction [17.548548562222766]
イベント抽出のための読解フレームワークを提案する。
適切なクエリテンプレートを構築することで,タスクやラベルのセマンティクスに関する豊富な知識を効果的に抽出することができる。
本手法は,ACE 2005ベンチマークにおいて,全監督訓練を行った場合の最先端性能を実現する。
論文 参考訳(メタデータ) (2020-10-21T21:48:39Z) - Document-Level Event Role Filler Extraction using Multi-Granularity
Contextualized Encoding [40.13163091122463]
イベントロールフィラーに対応するテキストの幅を決定するために、より大きなコンテキストのビューを必要とするため、イベント抽出は難しいタスクである。
まず、文書レベルのロールフィラー抽出において、エンドツーエンドのニューラルシーケンスモデルがどのように機能するかを検討する。
私たちの最高のシステムは、以前の作業よりもかなり優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2020-05-13T20:42:17Z) - Probabilistic Model of Narratives Over Topical Trends in Social Media: A
Discrete Time Model [4.073849137967964]
本稿では,イベントベースの物語要約抽出フレームワークを提案する。
我々のフレームワークは確率論的トピックモデルとして設計され、分類時間分布と抽出テキスト要約が続く。
我々は、シリアのホワイトヘルメッツに対して行われた偽情報キャンペーンのドメインで100万以上のツイートを含む、Twitterデータの大規模なコーパスで、我々のモデルを評価した。
論文 参考訳(メタデータ) (2020-04-14T20:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。