論文の概要: A Semi-Supervised Framework for Misinformation Detection
- arxiv url: http://arxiv.org/abs/2304.11318v1
- Date: Sat, 22 Apr 2023 05:20:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 19:17:39.521469
- Title: A Semi-Supervised Framework for Misinformation Detection
- Title(参考訳): 誤情報検出のための半教師付きフレームワーク
- Authors: Yueyang Liu, Zois Boukouvalas, and Nathalie Japkowicz
- Abstract要約: ソーシャルメディアで誤報が広まることが、社会的な問題となっている。
極度のクラス不均衡に対処する半教師付き学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.029433950934382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The spread of misinformation in social media outlets has become a prevalent
societal problem and is the cause of many kinds of social unrest. Curtailing
its prevalence is of great importance and machine learning has shown
significant promise. However, there are two main challenges when applying
machine learning to this problem. First, while much too prevalent in one
respect, misinformation, actually, represents only a minor proportion of all
the postings seen on social media. Second, labeling the massive amount of data
necessary to train a useful classifier becomes impractical. Considering these
challenges, we propose a simple semi-supervised learning framework in order to
deal with extreme class imbalances that has the advantage, over other
approaches, of using actual rather than simulated data to inflate the minority
class. We tested our framework on two sets of Covid-related Twitter data and
obtained significant improvement in F1-measure on extremely imbalanced
scenarios, as compared to simple classical and deep-learning data generation
methods such as SMOTE, ADASYN, or GAN-based data generation.
- Abstract(参考訳): ソーシャルメディアにおける誤報の拡散は、社会問題として普及し、様々な社会的不安の原因となっている。
その普及度を測ることは非常に重要であり、機械学習は大きな可能性を秘めている。
しかし、この問題に機械学習を適用する場合、大きな課題が2つある。
第一に、ある面ではあまりにも一般的すぎるが、事実、誤報はソーシャルメディアで見られる投稿のごく一部にすぎない。
第二に、有用な分類器の訓練に必要な膨大なデータのラベル付けが非現実的になる。
これらの課題を考慮し、マイノリティクラスを膨らませるためにシミュレーションデータではなく、実際のデータを使うという他のアプローチよりも有利な極端なクラス不均衡に対処するための、単純な半教師付き学習フレームワークを提案する。
2組のcovid-19関連twitterデータをテストし,smote,adasyn,ganベースのデータ生成などの単純な古典的およびディープラーニングデータ生成手法と比較して,極めて不均衡なシナリオにおけるf1測定の大幅な改善を得た。
関連論文リスト
- GENIU: A Restricted Data Access Unlearning for Imbalanced Data [7.854651232997996]
クラスアンラーニングでは、トレーニングされたモデルが、以前に学習した特定のクラスに属するデータを忘れることを可能にする。
GENIUは、非学習不均衡なデータ設定と制限されたデータアクセスのための最初の実践的フレームワークである。
論文 参考訳(メタデータ) (2024-06-12T05:24:53Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Non-Invasive Fairness in Learning through the Lens of Data Drift [88.37640805363317]
データや学習アルゴリズムを変更することなく、機械学習モデルの公平性を向上する方法を示す。
異なる集団間の傾向のばらつきと、学習モデルと少数民族間の連続的な傾向は、データドリフトと類似している。
このドリフトを解決するための2つの戦略(モデル分割とリウィーディング)を探索し、基礎となるデータに対するモデル全体の適合性を改善することを目的としている。
論文 参考訳(メタデータ) (2023-03-30T17:30:42Z) - A Survey on Class Imbalance in Federated Learning [6.632451878730774]
フェデレーション学習は、ネットワーク内の複数のクライアントデバイスが、クライアントのデータを直接露出することなく、機械学習モデルを共同でトレーニングすることを可能にする。
連合学習で訓練されたモデルは通常、標準集中学習モードで訓練されたモデルよりもパフォーマンスが悪いことが判明した。
論文 参考訳(メタデータ) (2023-03-21T08:34:23Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - GAN based Data Augmentation to Resolve Class Imbalance [0.0]
多くの関連するタスクにおいて、データセットは非常に少数の不正事件が観察される。
この不均衡の存在は、すべてのラベルを大多数のクラスとして予測することで、学習モデルの振舞いに影響を与える可能性がある。
我々はGAN(Generative Adversarial Network)を訓練し、少数民族の説得力のある(かつ信頼性の高い)合成例を多数生成した。
論文 参考訳(メタデータ) (2022-06-12T21:21:55Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Active Learning for Skewed Data Sets [25.866341631677688]
重度のクラス不均衡(スキュー)と少数の初期訓練データという2つの特徴を持つ問題に焦点をあてる。
本研究では,現在ラベル付けされているトレーニング例を通じて利用可能な知識を活用できるハイブリッド能動学習アルゴリズム(HAL)を提案する。
論文 参考訳(メタデータ) (2020-05-23T01:50:19Z) - Contrastive Examples for Addressing the Tyranny of the Majority [83.93825214500131]
我々は,グループメンバーシップを介在する,オリジナルのデータセットと新たなデータポイントからなるバランスの取れたトレーニングデータセットを作成することを提案する。
コントラッシブ・サンプル(英語版)と呼ばれるこれらのデータポイントを学習するための強力なツールとして、現在の生成的敵ネットワークが重要であることを示す。
論文 参考訳(メタデータ) (2020-04-14T14:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。