論文の概要: Named Entity Recognition for Monitoring Plant Health Threats in Tweets:
a ChouBERT Approach
- arxiv url: http://arxiv.org/abs/2310.12522v1
- Date: Thu, 19 Oct 2023 06:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 16:37:28.504338
- Title: Named Entity Recognition for Monitoring Plant Health Threats in Tweets:
a ChouBERT Approach
- Title(参考訳): ツイート中の植物の健康リスクモニタリングのための名前付きエンティティ認識:ChouBERTアプローチ
- Authors: Shufan Jiang (CRESTIC, ISEP), Rafael Angarita (ISEP), St\'ephane
Cormier (CRESTIC), Francis Rousseaux (CRESTIC)
- Abstract要約: ChouBERTは訓練済みの言語モデルで、植物健康問題の観察に関するつぶやきを特定できる。
本稿では,小さなラベル付き集合上でのトークンレベルのアノテーションタスクに関するChouBERTのノウハウを更に研究することによって,ラベル付きデータの欠如に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An important application scenario of precision agriculture is detecting and
measuring crop health threats using sensors and data analysis techniques.
However, the textual data are still under-explored among the existing solutions
due to the lack of labelled data and fine-grained semantic resources. Recent
research suggests that the increasing connectivity of farmers and the emergence
of online farming communities make social media like Twitter a participatory
platform for detecting unfamiliar plant health events if we can extract
essential information from unstructured textual data. ChouBERT is a French
pre-trained language model that can identify Tweets concerning observations of
plant health issues with generalizability on unseen natural hazards. This paper
tackles the lack of labelled data by further studying ChouBERT's know-how on
token-level annotation tasks over small labeled sets.
- Abstract(参考訳): 精密農業の重要な応用シナリオは、センサとデータ分析技術を使って作物の健康の脅威を検出し測定することである。
しかしながら、ラベル付きデータやきめ細かなセマンティックリソースがないため、既存のソリューションの中ではまだテキストデータは未検討のままである。
最近の研究では、農家のコネクティビティの増大とオンライン農業コミュニティの出現により、twitterのようなソーシャルメディアは、非構造化テキストデータから本質的な情報を抽出できれば、不慣れな植物健康事象を検出するための参加プラットフォームになっていることが示唆されている。
ChouBERTはフランスの事前訓練型言語モデルで、植物健康問題に対する観察に関するつぶやきを特定できる。
本稿では,小さなラベル付き集合上でのトークンレベルのアノテーションタスクに関するChouBERTのノウハウをさらに研究することによって,ラベル付きデータの欠如に対処する。
関連論文リスト
- Epidemiology-informed Network for Robust Rumor Detection [59.89351792706995]
本稿では, 疫学知識を統合し, 性能を高めるための新しい疫学情報ネットワーク(EIN)を提案する。
疫学理論をうわさ検出に適応させるため,各利用者が情報源情報に対する姿勢を付加することが期待されている。
実験結果から,提案したEINは実世界のデータセット上で最先端の手法より優れるだけでなく,樹木の深度にまたがる堅牢性も向上することが示された。
論文 参考訳(メタデータ) (2024-11-20T00:43:32Z) - UCE-FID: Using Large Unlabeled, Medium Crowdsourced-Labeled, and Small
Expert-Labeled Tweets for Foodborne Illness Detection [8.934980946374367]
食品性疾患検出のための深層学習フレームワークEGALを提案する。
EGALは、クラウドソーシングされた大量のラベルのないデータによって強化された、専門家ラベル付き小さなツイートを使用する。
EGALは、ツイートストリーミングのリアルタイム分析のためにデプロイされる可能性がある。
論文 参考訳(メタデータ) (2023-12-02T21:03:23Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Foveate, Attribute, and Rationalize: Towards Physically Safe and
Trustworthy AI [76.28956947107372]
包括的不安全テキストは、日常的なシナリオから生じる可能性のある特定の関心領域であり、有害なテキストを検出するのが困難である。
安全の文脈において、信頼に値する合理的な生成のために外部知識を活用する新しいフレームワークであるFARMを提案する。
実験の結果,FARMはSafeTextデータセットの最先端結果を得ることができ,安全性の分類精度が5.9%向上したことがわかった。
論文 参考訳(メタデータ) (2022-12-19T17:51:47Z) - TWEET-FID: An Annotated Dataset for Multiple Foodborne Illness Detection
Tasks [14.523433519237607]
食中毒は深刻なが予防可能な公衆衛生上の問題である。
効果的なアウトブレイク検出モデルを開発するためにラベル付きデータセットが不足している。
TWEET-FIDは、食品性疾患検出タスクのための、初めて公開された注釈付きデータセットである。
論文 参考訳(メタデータ) (2022-05-22T03:47:18Z) - Graph-based Joint Pandemic Concern and Relation Extraction on Twitter [19.7176519744206]
公衆の懸念検出は、パンデミックの流行前またはその間、危機管理のための当局に潜在的ガイダンスを提供する。
ソーシャルメディアの膨大な情報から時間内の懸念を検出することは、大きな課題であることがわかりました。
本稿では,人々の関心事とそれに対応する関係を識別する新しいエンド・ツー・エンドのディープラーニングモデルを提案する。
論文 参考訳(メタデータ) (2021-06-18T06:06:35Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - Reconciling Security and Utility in Next-Generation Epidemic Risk Mitigation Systems [49.05741109401773]
ユーザのプライバシをリッチなデータ収集と整合させるシステムであるSilmarillionを提案する。
Silmarillionでは、ユーザーデバイスが戦略的場所に設置されたビーコンでBluetoothの遭遇を記録する。
ユーザプライバシとデータセキュリティを保証するSilmarillionとその通信プロトコルの設計について述べる。
論文 参考訳(メタデータ) (2020-11-16T16:19:37Z) - Sensitive Information Detection: Recursive Neural Networks for Encoding
Context [0.20305676256390928]
機密情報の漏洩は非常にコストがかかる可能性がある。
感度情報を検出するための簡易で脆いルールセットは、実際の感度情報のごく一部しか見つからないことを示す。
我々は,ラベル付き事例へのアクセスのみを前提とした,機密情報検出手法の新たなファミリーを開発する。
論文 参考訳(メタデータ) (2020-08-25T07:49:46Z) - Leveraging Multi-Source Weak Social Supervision for Early Detection of
Fake News [67.53424807783414]
ソーシャルメディアは、人々が前例のない速度でオンライン活動に参加することを可能にする。
この制限のないアクセスは、誤情報や偽ニュースの拡散を悪化させ、その緩和のために早期に検出されない限り混乱と混乱を引き起こす可能性がある。
ソーシャルエンゲージメントからの弱い信号とともに、限られた量のクリーンデータを活用して、メタラーニングフレームワークでディープニューラルネットワークをトレーニングし、さまざまな弱いインスタンスの品質を推定します。
実世界のデータセットの実験では、提案されたフレームワークは、予測時にユーザーエンゲージメントを使わずに、フェイクニュースを早期に検出するための最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-04-03T18:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。