論文の概要: DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet
Classification via Memory Bank
- arxiv url: http://arxiv.org/abs/2310.14577v1
- Date: Mon, 23 Oct 2023 05:25:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 22:18:55.556235
- Title: DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet
Classification via Memory Bank
- Title(参考訳): DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet Classification by Memory Bank
- Authors: Henry Peng Zou, Yue Zhou, Weizhi Zhang, Cornelia Caragea
- Abstract要約: 危機イベントにおいて、人々は、状況、警告、アドバイス、サポートに関する情報を広めるために、Twitterのようなソーシャルメディアプラットフォームを使うことが多い。
完全に教師されたアプローチでは、大量のデータを注釈付けする必要があります。
半教師付きモデルは偏りがあり、特定のクラスでは適度に機能し、他のクラスでは極めて貧弱である。
本稿では,メモリバンクを用いて,各学習クラスから生成された擬似ラベルを等しくサンプリングする,単純かつ効果的なデバイアス処理手法であるDeCrisisMBを提案する。
- 参考スコア(独自算出の注目度): 52.20298962359658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During crisis events, people often use social media platforms such as Twitter
to disseminate information about the situation, warnings, advice, and support.
Emergency relief organizations leverage such information to acquire timely
crisis circumstances and expedite rescue operations. While existing works
utilize such information to build models for crisis event analysis,
fully-supervised approaches require annotating vast amounts of data and are
impractical due to limited response time. On the other hand, semi-supervised
models can be biased, performing moderately well for certain classes while
performing extremely poorly for others, resulting in substantially negative
effects on disaster monitoring and rescue. In this paper, we first study two
recent debiasing methods on semi-supervised crisis tweet classification. Then
we propose a simple but effective debiasing method, DeCrisisMB, that utilizes a
Memory Bank to store and perform equal sampling for generated pseudo-labels
from each class at each training iteration. Extensive experiments are conducted
to compare different debiasing methods' performance and generalization ability
in both in-distribution and out-of-distribution settings. The results
demonstrate the superior performance of our proposed method. Our code is
available at https://github.com/HenryPengZou/DeCrisisMB.
- Abstract(参考訳): 危機イベントの間、人々はTwitterのようなソーシャルメディアプラットフォームを使って状況、警告、アドバイス、サポートに関する情報を広める。
緊急救助組織は、そのような情報を利用して、タイムリーな危機状況を取得し、迅速な救助活動を行う。
既存の研究は危機イベント分析のためのモデルを構築するためにそのような情報を利用しているが、完全に監督されたアプローチでは膨大な量のデータを注釈付けする必要がある。
一方、半教師付きモデルは偏りがあり、特定のクラスでは適度に機能し、他のクラスでは極めて劣悪であり、災害監視や救助に著しく悪影響を及ぼす。
本稿では,最近,半教師付き危機ツイート分類におけるデバイアス手法を2つ検討した。
次に,メモリバンクを用いて各クラスから生成された擬似ラベルに対して,トレーニングイテレーション毎に均等なサンプリングを行う,簡易かつ効果的なデバイアス手法であるdecrisismbを提案する。
分散状態と分散状態の両方で異なるデバイアス法の性能と一般化能力を比較検討した。
その結果,提案手法の優れた性能が示された。
私たちのコードはhttps://github.com/HenryPengZou/DeCrisisMBで利用可能です。
関連論文リスト
- CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.2719253711215]
本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文 参考訳(メタデータ) (2024-06-16T23:01:10Z) - TESSERACT: Eliminating Experimental Bias in Malware Classification
across Space and Time (Extended Version) [18.146377453918724]
マルウェア検知器は、常に進化するオペレーティングシステムや攻撃方法によって、しばしば性能劣化を経験する。
本論文は, 検出作業における2つの実験バイアス源により, 一般的に報告される結果が膨らんでいることを論じる。
論文 参考訳(メタデータ) (2024-02-02T12:27:32Z) - Segue: Side-information Guided Generative Unlearnable Examples for
Facial Privacy Protection in Real World [64.4289385463226]
生成不可能な例としては、Segue: Side-information guided Generative unlearnable Exampleを提案する。
転送性を向上させるために,真のラベルや擬似ラベルなどの側面情報を導入する。
JPEG圧縮、敵対的トレーニング、およびいくつかの標準的なデータ拡張に抵抗することができる。
論文 参考訳(メタデータ) (2023-10-24T06:22:37Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。