論文の概要: Rumour detection using graph neural network and oversampling in
benchmark Twitter dataset
- arxiv url: http://arxiv.org/abs/2212.10080v1
- Date: Tue, 20 Dec 2022 08:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 14:09:32.183336
- Title: Rumour detection using graph neural network and oversampling in
benchmark Twitter dataset
- Title(参考訳): ベンチマークTwitterデータセットにおけるグラフニューラルネットワークとオーバーサンプリングを用いたルール検出
- Authors: Shaswat Patel, Prince Bansal, Preeti Kaur
- Abstract要約: 本稿では,オーバサンプリングに着目した自動噂検出システムの構築手法を提案する。
オーバーサンプリング手法は,データセットの不足したクラスに対する合成サンプルを生成するために,文脈的データ拡張に頼っている。
スレッド上の非線形会話をモデル化するために、2つのグラフニューラルネットワーク(GNN)を提案する。
- 参考スコア(独自算出の注目度): 0.30079490585515345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, online social media has become a primary source for new information
and misinformation or rumours. In the absence of an automatic rumour detection
system the propagation of rumours has increased manifold leading to serious
societal damages. In this work, we propose a novel method for building
automatic rumour detection system by focusing on oversampling to alleviating
the fundamental challenges of class imbalance in rumour detection task. Our
oversampling method relies on contextualised data augmentation to generate
synthetic samples for underrepresented classes in the dataset. The key idea
exploits selection of tweets in a thread for augmentation which can be achieved
by introducing a non-random selection criteria to focus the augmentation
process on relevant tweets. Furthermore, we propose two graph neural
networks(GNN) to model non-linear conversations on a thread. To enhance the
tweet representations in our method we employed a custom feature selection
technique based on state-of-the-art BERTweet model. Experiments of three
publicly available datasets confirm that 1) our GNN models outperform the the
current state-of-the-art classifiers by more than 20%(F1-score); 2) our
oversampling technique increases the model performance by more than
9%;(F1-score) 3) focusing on relevant tweets for data augmentation via
non-random selection criteria can further improve the results; and 4) our
method has superior capabilities to detect rumours at very early stage.
- Abstract(参考訳): 近年,オンラインソーシャルメディアは新たな情報や誤情報や噂の源泉となっている。
自動的な噂検出システムがないと、噂の伝搬が増大し、社会に深刻な被害をもたらす。
本研究では, クラス不均衡の課題を解消するために, オーバーサンプリングに焦点をあてて, 自動噂検知システムを構築する手法を提案する。
オーバーサンプリング手法は,データセットの未表現クラスに対する合成サンプルを生成するために,文脈データ拡張に依存する。
重要なアイデアは、スレッド内のツイートの選択を利用して、非ランダムな選択基準を導入して、関連するツイートに集中させることによって達成できる。
さらに、スレッド上の非線形会話をモデル化する2つのグラフニューラルネットワーク(GNN)を提案する。
提案手法では,最先端のBERTweetモデルに基づくカスタム機能選択手法を用いて,ツイート表現を強化する。
3つの公開データセットの実験がそれを確認
1) GNNモデルは、現在の最先端分類器を20%以上上回る(F1スコア)。
2) オーバーサンプリング技術は, モデル性能を9%以上向上させる(f1-score)。
3)非ランダム選択基準によるデータ拡張のための関連ツイートにフォーカスすることで,さらに結果が向上する。
4)本手法は早期に噂を検出する能力に優れていた。
関連論文リスト
- SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Enhancing Cross-Dataset Performance of Distracted Driving Detection With
Score-Softmax Classifier [7.302402275736439]
ディープニューラルネットワークは、車内ドライバのリアルタイム監視を可能にし、気晴らし、疲労、潜在的な危険のタイムリーな予測を容易にする。
最近の研究では、オーバーフィッティングによる信頼性の低いクロスデータセットのエンドツーエンドドライバの動作認識が明らかにされている。
Score-Softmax分類器を導入し、クラス間独立性とクラス内不確実性を高めることでこの問題に対処する。
論文 参考訳(メタデータ) (2023-10-08T15:28:01Z) - Neural Priming for Sample-Efficient Adaptation [92.14357804106787]
ニューラルプライミング(Neural Priming)は、大規模な事前学習されたモデルを分散シフトや下流タスクに適応させる手法である。
ニューラルプライミングは、LAION-2Bほどの大きさの事前訓練であっても、テスト時に行うことができる。
論文 参考訳(メタデータ) (2023-06-16T21:53:16Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - On Automatic Data Augmentation for 3D Point Cloud Classification [19.338266486983176]
両レベル最適化を用いてデータ拡張戦略を自動学習することを提案する。
拡張器は条件付きジェネレータと同じような設計で、バリデーションセットにおけるベースモデルの損失を最小限に抑えて最適化される。
標準的なクラウド分類タスクに対する我々のアプローチと、トレーニングと検証/テストセットのミスアライメントによるより困難な設定について評価する。
論文 参考訳(メタデータ) (2021-12-11T17:14:16Z) - Ensemble Augmentation for Deep Neural Networks Using 1-D Time Series
Vibration Data [0.0]
時系列データは、データ駆動技術で使用される生データ表現の基本的なタイプの1つである。
Deep Neural Networks(DNN)は、最適なパフォーマンスを得るために、巨大なラベル付きトレーニングサンプルを必要とする。
本研究では,この制限を克服するために,アンサンブル拡張と呼ばれるデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2021-08-06T20:04:29Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - A Two-Stage Approach to Device-Robust Acoustic Scene Classification [63.98724740606457]
デバイスロバスト性を改善するために,完全畳み込みニューラルネットワーク(CNN)に基づく2段階システムを提案する。
以上の結果から,提案したASCシステムにより,開発環境における最先端の精度が得られた。
クラスアクティベーションマッピングを用いたニューラルサリエンシ解析により、モデルによって学習されたパターンに関する新たな洞察が得られる。
論文 参考訳(メタデータ) (2020-11-03T03:27:18Z) - Ensemble Wrapper Subsampling for Deep Modulation Classification [70.91089216571035]
受信した無線信号のサブサンプリングは、ハードウェア要件と信号処理アルゴリズムの計算コストを緩和するために重要である。
本稿では,無線通信システムにおけるディープラーニングを用いた自動変調分類のためのサブサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-10T06:11:13Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。