論文の概要: Auditing and Robustifying COVID-19 Misinformation Datasets via
Anticontent Sampling
- arxiv url: http://arxiv.org/abs/2310.07078v1
- Date: Sat, 5 Aug 2023 22:38:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:23:17.428207
- Title: Auditing and Robustifying COVID-19 Misinformation Datasets via
Anticontent Sampling
- Title(参考訳): アンチコンテントサンプリングによるcovid-19誤情報の監査と強固化
- Authors: Clay H. Yoo and Ashiqur R. KhudaBukhsh
- Abstract要約: 新型コロナウイルス(COVID-19)の誤情報検出の文脈では、複数のデータセットのWild内監査を行います。
我々は、最近引用されたいくつかの顕著なデータセットでトレーニングされたモデルが、野生で評価された場合、アンチコンテントに弱いことを実証した。
そこで本研究では,手動のアノテーションをゼロにする必要のある新たなアクティブ学習パイプラインを提案する。
- 参考スコア(独自算出の注目度): 18.63770999247311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper makes two key contributions. First, it argues that highly
specialized rare content classifiers trained on small data typically have
limited exposure to the richness and topical diversity of the negative class
(dubbed anticontent) as observed in the wild. As a result, these classifiers'
strong performance observed on the test set may not translate into real-world
settings. In the context of COVID-19 misinformation detection, we conduct an
in-the-wild audit of multiple datasets and demonstrate that models trained with
several prominently cited recent datasets are vulnerable to anticontent when
evaluated in the wild. Second, we present a novel active learning pipeline that
requires zero manual annotation and iteratively augments the training data with
challenging anticontent, robustifying these classifiers.
- Abstract(参考訳): この論文は2つの重要な貢献をする。
第一に、小型データで訓練された高度に特殊なレアなコンテンツ分類器は、一般的に野生で観察される負のクラス(アンチコンテント)の豊かさと局所的な多様性に限定される。
その結果、テストセットで観察されたこれらの分類器の強い性能は、現実世界の設定に変換されない。
新型コロナウイルス(covid-19)の誤情報検出の文脈では、複数のデータセットを内部で監査し、最近言及されているいくつかのデータセットでトレーニングされたモデルは、ワイルドで評価すると反コンテンツに弱いことを実証する。
第2に,手動アノテーションを必要とせず,反コンテントに挑戦してトレーニングデータを反復的に強化し,これらの分類器を堅牢化する,新たなアクティブラーニングパイプラインを提案する。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Towards Weakly-Supervised Hate Speech Classification Across Datasets [47.101942709219784]
そこで本研究では,テキスト分類モデルの有効性について検討した。
また,HS分類モデルの一般化性の低さの原因について,詳細な定量的,定性的な分析を行った。
論文 参考訳(メタデータ) (2023-05-04T08:15:40Z) - Defect detection using weakly supervised learning [1.4321190258774352]
近年,従来の教師あり学習の代替手段として,弱教師あり学習技術が注目されている。
本稿では,欠陥検出作業において,弱教師付き分類器と完全教師付き分類器の性能を比較した。
論文 参考訳(メタデータ) (2023-03-27T11:01:16Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Adversarial Contrastive Self-Supervised Learning [13.534367890379853]
オンライン・ハード・ネガティブ・ペア・マイニングに基づく自己教師型深層学習パラダイムを提案する。
正の試料対と固負の試料対の両方を考慮した新しい三重項類似の損失を導出した。
論文 参考訳(メタデータ) (2022-02-26T05:57:45Z) - Neighborhood Contrastive Learning for Novel Class Discovery [79.14767688903028]
我々は,クラスタリング性能に重要な識別表現を学習するために,Neighborhood Contrastive Learningという新しいフレームワークを構築した。
これらの2つの成分がクラスタリング性能に大きく寄与し、我々のモデルが最先端の手法よりも大きなマージンで優れていることを実験的に実証した。
論文 参考訳(メタデータ) (2021-06-20T17:34:55Z) - Learning Invariant Representations across Domains and Tasks [81.30046935430791]
本稿では,この教師なしタスク転送問題を解決するための新しいタスク適応ネットワーク(tan)を提案する。
ドメイン・アドバーサル・トレーニングによる伝達可能な機能を学習することに加えて、学習から学習への戦略を用いてタスクの意味を適応させる新しいタスク・セマンティクス・アダプタを提案する。
TANは最近の強いベースラインに比べてリコールとF1スコアを5.0%と7.8%大きく向上させた。
論文 参考訳(メタデータ) (2021-03-03T11:18:43Z) - Ask-n-Learn: Active Learning via Reliable Gradient Representations for
Image Classification [29.43017692274488]
深い予測モデルは、ラベル付きトレーニングデータという形で人間の監督に依存する。
Ask-n-Learnは,各アルゴリズムで推定されたペスドラベルを用いて得られる勾配埋め込みに基づく能動的学習手法である。
論文 参考訳(メタデータ) (2020-09-30T05:19:56Z) - Adding Seemingly Uninformative Labels Helps in Low Data Regimes [6.953976287091344]
マンモグラフィー画像における腫瘍のセグメンテーションという,専門的アノテーションを必要とする課題について考察する。
低データ設定では、専門家アノテーションと非専門家アノテーションの非形式的なラベルを補完し、タスクをマルチクラス問題にすることで、パフォーマンスを向上させることができることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:38:59Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。