論文の概要: Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain
- arxiv url: http://arxiv.org/abs/2407.10807v1
- Date: Mon, 15 Jul 2024 15:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 14:39:57.501927
- Title: Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain
- Title(参考訳): フェイクニュース領域のデータストリーム分類における文空間埋め込みの利用
- Authors: Paweł Zyblewski, Jakub Klikowski, Weronika Borek-Marciniec, Paweł Ksieniewicz,
- Abstract要約: 本稿では,文空間法を用いた自然言語データストリーム分類手法を提案する。
画像分類専用の畳み込みディープネットワークを使用することで、テキストデータに基づいてフェイクニュースを認識できる。
実生活のFakedditデータセットに基づいて,提案手法をデータストリーム分類のための最先端アルゴリズムと比較した。
- 参考スコア(独自算出の注目度): 0.24999074238880487
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Tabular data is considered the last unconquered castle of deep learning, yet the task of data stream classification is stated to be an equally important and demanding research area. Due to the temporal constraints, it is assumed that deep learning methods are not the optimal solution for application in this field. However, excluding the entire -- and prevalent -- group of methods seems rather rash given the progress that has been made in recent years in its development. For this reason, the following paper is the first to present an approach to natural language data stream classification using the sentence space method, which allows for encoding text into the form of a discrete digital signal. This allows the use of convolutional deep networks dedicated to image classification to solve the task of recognizing fake news based on text data. Based on the real-life Fakeddit dataset, the proposed approach was compared with state-of-the-art algorithms for data stream classification based on generalization ability and time complexity.
- Abstract(参考訳): タブラル・データ(Tabular data)は、ディープラーニングにおける最後の未解決の城と考えられているが、データストリーム分類の課題は、等しく重要で要求の多い研究領域であると言われている。
時間的制約のため、この分野での深層学習法は最適解ではないと仮定される。
しかし、近年開発が進んできた進歩を考えると、(そして広く普及している)メソッドグループ全体を除くと、かなり過激に思える。
そこで本論文では,文空間法を用いて自然言語データストリーム分類のアプローチを初めて提示し,テキストを離散ディジタル信号の形式に符号化する手法を提案する。
これにより、画像分類専用の畳み込みディープネットワークを使用して、テキストデータに基づいて偽ニュースを認識するタスクを解決することができる。
The real-life Fakeddit data based on the real-life Fakeddit approach was compared to state-of-the-art algorithm for data stream classification based on generalization ability and time complexity。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - LatentForensics: Towards frugal deepfake detection in the StyleGAN latent space [2.629091178090276]
本稿では,高品質な顔画像で訓練された最先端生成逆数ネットワーク(GAN)の潜時空間で動作するディープフェイク検出手法を提案する。
標準データセットの実験結果から,提案手法が他の最先端のディープフェイク分類法よりも優れていることが明らかになった。
論文 参考訳(メタデータ) (2023-03-30T08:36:48Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Dominant Set-based Active Learning for Text Classification and its
Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。
提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。
本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2022-01-28T19:19:03Z) - Active Weighted Aging Ensemble for Drifted Data Stream Classification [2.277447144331876]
概念ドリフトは分類モデルの性能を不安定化し、その品質を著しく低下させる。
提案手法は実データストリームと実データストリームの両方を用いて計算機実験により評価されている。
その結果,提案アルゴリズムは最先端手法よりも高品質であることが確認された。
論文 参考訳(メタデータ) (2021-12-19T13:52:53Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - The Application of Active Query K-Means in Text Classification [0.0]
アクティブ・ラーニング(Active Learning)は、ラベルのない大量のデータを扱う最先端の機械学習アプローチである。
従来の教師なしk平均クラスタリングは、この研究で最初に半教師付きバージョンに修正される。
また,Penalized Min-Max-Selectionを用いて,アルゴリズムをさらにアクティブな学習シナリオに拡張する試みを行った。
中国のニュースデータセットでテストした結果、トレーニングのコストを下げながら精度が一貫した向上を示した。
論文 参考訳(メタデータ) (2021-07-16T03:06:35Z) - TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for
Unsupervised Sentence Embedding Learning [53.32740707197856]
TSDAE(Sequential Denoising Auto-Encoder)を用いた最新の非監視方式を提案する。
ドメイン内の監視されたアプローチのパフォーマンスの93.1%を達成することができる。
論文 参考訳(メタデータ) (2021-04-14T17:02:18Z) - Revisiting Mahalanobis Distance for Transformer-Based Out-of-Domain
Detection [60.88952532574564]
本稿では,ドメイン外インテント検出手法を徹底的に比較する。
意図分類のための3つの標準データセット上で,複数のコンテキストエンコーダとメソッドを効率良く評価する。
本研究の主目的は,超微調整トランスフォーマーを用いたドメイン内データエンコーダが優れた結果をもたらすことである。
論文 参考訳(メタデータ) (2021-01-11T09:10:58Z) - Focus on Semantic Consistency for Cross-domain Crowd Understanding [34.560447389853614]
いくつかのドメイン適応アルゴリズムは、合成データでモデルをトレーニングすることでそれを解放しようとする。
その結果,背景領域における推定誤差が既存手法の性能を阻害していることが判明した。
本稿では,ドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-02-20T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。