論文の概要: TWEET-FID: An Annotated Dataset for Multiple Foodborne Illness Detection
Tasks
- arxiv url: http://arxiv.org/abs/2205.10726v1
- Date: Sun, 22 May 2022 03:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 14:14:39.164281
- Title: TWEET-FID: An Annotated Dataset for Multiple Foodborne Illness Detection
Tasks
- Title(参考訳): TWEET-FID:複数の食中毒検出タスクのための注釈付きデータセット
- Authors: Ruofan Hu, Dongyu Zhang, Dandan Tao, Thomas Hartvigsen, Hao Feng, Elke
Rundensteiner
- Abstract要約: 食中毒は深刻なが予防可能な公衆衛生上の問題である。
効果的なアウトブレイク検出モデルを開発するためにラベル付きデータセットが不足している。
TWEET-FIDは、食品性疾患検出タスクのための、初めて公開された注釈付きデータセットである。
- 参考スコア(独自算出の注目度): 14.523433519237607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foodborne illness is a serious but preventable public health problem -- with
delays in detecting the associated outbreaks resulting in productivity loss,
expensive recalls, public safety hazards, and even loss of life. While social
media is a promising source for identifying unreported foodborne illnesses,
there is a dearth of labeled datasets for developing effective outbreak
detection models. To accelerate the development of machine learning-based
models for foodborne outbreak detection, we thus present TWEET-FID
(TWEET-Foodborne Illness Detection), the first publicly available annotated
dataset for multiple foodborne illness incident detection tasks. TWEET-FID
collected from Twitter is annotated with three facets: tweet class, entity
type, and slot type, with labels produced by experts as well as by crowdsource
workers. We introduce several domain tasks leveraging these three facets: text
relevance classification (TRC), entity mention detection (EMD), and slot
filling (SF). We describe the end-to-end methodology for dataset design,
creation, and labeling for supporting model development for these tasks. A
comprehensive set of results for these tasks leveraging state-of-the-art
single- and multi-task deep learning methods on the TWEET-FID dataset are
provided. This dataset opens opportunities for future research in foodborne
outbreak detection.
- Abstract(参考訳): 食中毒は深刻なが予防可能な公衆衛生上の問題であり、関連するアウトブレイクの発見が遅れ、生産性の低下、高価なリコール、公衆安全の危険、さらには生命の喪失に至る。
ソーシャルメディアは、報告されていない食中毒の特定に有望な情報源であるが、効果的なアウトブレイク検出モデルを開発するためのラベル付きデータセットが多数存在する。
そこで本研究では,食品病発生検出のための機械学習モデルの開発を加速するため,複数の食品病発生検出タスクのための最初のアノテートデータセットであるTWEET-FID(TWEET-Foodborne Illness Detection)を提案する。
twitterから収集されたtweet-fidには、tweetクラス、エンティティタイプ、スロットタイプという3つのアノテーションがあり、専門家やクラウドソースワーカーが作成したラベルがある。
テキスト関連分類(TRC)、エンティティ参照検出(EMD)、スロットフィリング(SF)の3つの側面を利用するドメインタスクを紹介した。
我々は、これらのタスクのモデル開発をサポートするために、データセットの設計、作成、ラベリングのためのエンドツーエンドの方法論について述べる。
TWEET-FIDデータセット上で、最先端のシングルタスクとマルチタスクのディープラーニング手法を活用することで、これらのタスクの包括的な結果が提供される。
このデータセットは、食中毒の検出における将来の研究の機会を開く。
関連論文リスト
- Self-supervised transformer-based pre-training method with General Plant Infection dataset [3.969851116372513]
本研究では、コントラスト学習とマスクド画像モデリング(MIM)を組み合わせた高度なネットワークアーキテクチャを提案する。
提案するネットワークアーキテクチャは,植物害虫や病原体認識タスクに対処し,優れた検出精度を実現する。
私たちのコードとデータセットは、植物害虫の研究と病気の認識を促進するために公開されます。
論文 参考訳(メタデータ) (2024-07-20T15:48:35Z) - UCE-FID: Using Large Unlabeled, Medium Crowdsourced-Labeled, and Small
Expert-Labeled Tweets for Foodborne Illness Detection [8.934980946374367]
食品性疾患検出のための深層学習フレームワークEGALを提案する。
EGALは、クラウドソーシングされた大量のラベルのないデータによって強化された、専門家ラベル付き小さなツイートを使用する。
EGALは、ツイートストリーミングのリアルタイム分析のためにデプロイされる可能性がある。
論文 参考訳(メタデータ) (2023-12-02T21:03:23Z) - WePaMaDM-Outlier Detection: Weighted Outlier Detection using Pattern
Approaches for Mass Data Mining [0.6754597324022876]
外乱検出は、システム障害、不正行為、およびデータ内のパターンに関する重要な情報を明らかにすることができる。
本稿では、異なる質量データマイニング領域を持つWePaMaDM-Outlier Detectionを提案する。
また, 監視, 故障検出, 傾向解析において, 異常検出技術におけるデータモデリングの重要性についても検討した。
論文 参考訳(メタデータ) (2023-06-09T07:00:00Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Weakly Supervised Anomaly Detection: A Survey [75.26180038443462]
異常検出(AD)は、さまざまなアプリケーションによる機械学習において重要なタスクである。
弱教師付き異常検出法(WSAD)の総合的な調査を行った。
各設定に対して、正式な定義、鍵アルゴリズム、潜在的な将来の方向性を提供する。
論文 参考訳(メタデータ) (2023-02-09T10:27:21Z) - LDD: A Dataset for Grape Diseases Object Detection and Instance
Segmentation [2.966925013268916]
インスタンスセグメンテーションアプローチによる疾患認識の最先端化を目標として、新たなデータセットが作成されている。
これは、自然の文脈で病気によって影響を受ける葉やブドウの群れのイメージを集めることで達成された。
このデータセットには、より一般的な8つのブドウ病の症状のない葉やブドウを含む10種類のオブジェクトの写真が含まれており、1,092枚の画像に合計17,706個のラベルが付けられている。
論文 参考訳(メタデータ) (2022-06-21T08:50:13Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - Genome Sequence Classification for Animal Diagnostics with Graph
Representations and Deep Neural Networks [4.339839287869652]
ウシ呼吸器疾患複合体(英: Bovine Respiratory Disease Complex, BRDC)は、ウシに細菌やウイルスを含む複数の病因を持つ複雑な呼吸器疾患である。
現在の動物疾患診断は、細菌培養、血清分析、PCR(PCR)検査などの従来の検査に基づいている。
ネットワークベースの機械学習アプローチは、最大89.7%の精度で病原体シグネチャを検出することができる。
論文 参考訳(メタデータ) (2020-07-24T22:30:18Z) - Data Mining with Big Data in Intrusion Detection Systems: A Systematic
Literature Review [68.15472610671748]
クラウドコンピューティングは、複雑で高性能でスケーラブルな計算のために、強力で必要不可欠な技術になっている。
データ生成の迅速化とボリュームは、データ管理とセキュリティに重大な課題をもたらし始めている。
ビッグデータ設定における侵入検知システム(IDS)の設計と展開が重要視されている。
論文 参考訳(メタデータ) (2020-05-23T20:57:12Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。