論文の概要: Plague Dot Text: Text mining and annotation of outbreak reports of the
Third Plague Pandemic (1894-1952)
- arxiv url: http://arxiv.org/abs/2002.01415v3
- Date: Mon, 11 Jan 2021 11:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 03:09:15.460587
- Title: Plague Dot Text: Text mining and annotation of outbreak reports of the
Third Plague Pandemic (1894-1952)
- Title(参考訳): プラハ・ドットテキスト:第3次プラハパンデミックの発生報告のテキストマイニングと注釈(1894年-1952年)
- Authors: Arlene Casey, Mike Bennett, Richard Tobin, Claire Grover, Iona Walker,
Lukas Engelmann, Beatrice Alex
- Abstract要約: 学際調査による第3次疫病パンデミックからの100件以上の報告の調査(1894年−1952年)
私たちのゴールは、世界第3位のパンデミックの疫学を理解するために使われた、最も重要な概念の構造化された説明を開発することです。
- 参考スコア(独自算出の注目度): 0.8114550931351494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The design of models that govern diseases in population is commonly built on
information and data gathered from past outbreaks. However, epidemic outbreaks
are never captured in statistical data alone but are communicated by
narratives, supported by empirical observations. Outbreak reports discuss
correlations between populations, locations and the disease to infer insights
into causes, vectors and potential interventions. The problem with these
narratives is usually the lack of consistent structure or strong conventions,
which prohibit their formal analysis in larger corpora. Our interdisciplinary
research investigates more than 100 reports from the third plague pandemic
(1894-1952) evaluating ways of building a corpus to extract and structure this
narrative information through text mining and manual annotation. In this paper
we discuss the progress of our ongoing exploratory project, how we enhance
optical character recognition (OCR) methods to improve text capture, our
approach to structure the narratives and identify relevant entities in the
reports. The structured corpus is made available via Solr enabling search and
analysis across the whole collection for future research dedicated, for
example, to the identification of concepts. We show preliminary visualisations
of the characteristics of causation and differences with respect to gender as a
result of syntactic-category-dependent corpus statistics. Our goal is to
develop structured accounts of some of the most significant concepts that were
used to understand the epidemiology of the third plague pandemic around the
globe. The corpus enables researchers to analyse the reports collectively
allowing for deep insights into the global epidemiological consideration of
plague in the early twentieth century.
- Abstract(参考訳): 人口の病気を管理するモデルの設計は、過去のアウトブレイクから収集した情報とデータに基づいている。
しかし、流行は統計データだけでは捉えられず、経験的な観察によって裏付けられた物語によって伝えられる。
アウトブレイクレポートでは、原因、ベクター、潜在的な介入に関する洞察を推測するために、人口、場所、疾患の間の相関について論じている。
これらの物語の問題は、通常一貫性のある構造や強い慣習の欠如であり、より大きなコーパスで形式的な分析を禁止している。
本研究は,第3次ペストパンデミック(1894-1952)の100件以上の報告を調査し,テキストマイニングとマニュアルアノテーションを用いて,物語情報を抽出・構造化するためのコーパスの構築方法について検討した。
本稿では,現在進行中の探索プロジェクトの進展,テキストキャプチャ向上のためのocr(optical character recognition)手法の強化,ナラティブの構成とレポートの関連エンティティの同定に関する我々のアプローチについて述べる。
構造化されたコーパスは、Solrを通じて、将来の研究、例えば概念の識別のために、コレクション全体の検索と分析を可能にする。
構文分類に依存したコーパス統計の結果,因果関係の特徴と性差の予備的可視化について述べる。
私たちの目標は、世界3位のパンデミックの疫学を理解するために使われた、最も重要な概念の構造化された説明を開発することです。
このコーパスによって研究者は、20世紀初頭の疫病の世界的な疫学的考察に関する深い知見を総合的に分析することができる。
関連論文リスト
- SPEED++: A Multilingual Event Extraction Framework for Epidemic Prediction and Preparedness [73.73883111570458]
多様な疾患や言語に対する流行イベント情報を抽出する,最初の多言語イベント抽出フレームワークを提案する。
各言語でデータに注釈を付けることは不可能であり、ゼロショット・クロスランガル・クロス・ディスリーズ・モデルを開発する。
われわれのフレームワークは、2019年12月初旬に中国のWeiboポストから、中国でのトレーニングなしに、新型コロナウイルスの流行を警告することができる。
論文 参考訳(メタデータ) (2024-10-24T03:03:54Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Event Detection from Social Media for Epidemic Prediction [76.90779562626541]
ソーシャルメディア投稿から疫病関連事象を抽出・分析する枠組みを構築した。
実験では、新型コロナウイルスベースのSPEEDで訓練されたEDモデルが、3つの目に見えない流行の流行を効果的に検出する方法が明らかにされている。
モンキーポックスのWHO流行宣言より4~9週間早く,抽出した事象の報告が急激な増加を示すことを示す。
論文 参考訳(メタデータ) (2024-04-02T06:31:17Z) - A Comparative Analysis of the COVID-19 Infodemic in English and Chinese:
Insights from Social Media Textual Data [2.641576480886427]
新型コロナウイルス(COVID-19)のインフォデミック(インフォデミック)は、パンデミックに関連する誤報や未確認の主張が急速に広まるのを特徴としている。
本稿では、ソーシャルメディアプラットフォームから抽出したテキストデータを用いて、英語と中国語におけるCOVID-19インフォデミックの比較分析を行った。
論文 参考訳(メタデータ) (2023-11-14T08:55:11Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - Coronavirus statistics causes emotional bias: a social media text mining
perspective [4.042350304426975]
本稿では,パンデミックに関連するテキストを場所ラベル付きテキストデータから分類する深層学習モデルを提案する。
次に,マルチタスク学習に基づく感情分析を行う。
最後に、感情分析の出力を伴う固定効果パネル回帰を実行する。
論文 参考訳(メタデータ) (2022-11-16T03:36:13Z) - When Infodemic Meets Epidemic: a Systematic Literature Review [3.3454373538792543]
ソーシャルメディアは、バイオサーベイランスに活用できる大量のデータを提供している。
この体系的な文献レビューは、さまざまな流行関連文脈におけるソーシャルメディアの統合の方法論的概要を提供する。
論文 参考訳(メタデータ) (2022-10-03T21:04:30Z) - Sentiment and Emotion Classification of Epidemic Related Bilingual data
from Social Media [1.7109522466982476]
この研究は、パキスタンのデング流行に関連するtwitterやニュースサイトからのバイリンガル(ウルドゥー語と英語)データを活用している。
本研究は,パキスタンにおけるデング流行に関連するTwitterおよびNEWSウェブサイトのバイリンガル(ウルドゥー語と英語)データを利用した。
論文 参考訳(メタデータ) (2021-05-04T12:51:18Z) - STOPPAGE: Spatio-temporal Data Driven Cloud-Fog-Edge Computing Framework
for Pandemic Monitoring and Management [28.205715426050105]
行政政策の改善とパンデミック対策のための準備を強化するための分析枠組みを開発することは絶対的に必要である。
本稿では,STOPと呼ばれる時空間知識マイニングフレームワークを提案し,時間スケールの異なる大規模地域における人間の移動性や文脈情報の影響をモデル化する。
i)fog/edgeベースのアーキテクチャを使用したs-temporal data and computing infrastructure、(ii)s-temporal data analyticsモジュールで、異種データソースから知識を効率的に抽出する。
論文 参考訳(メタデータ) (2021-04-04T12:29:31Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。