論文の概要: The effect of stemming and lemmatization on Portuguese fake news text
classification
- arxiv url: http://arxiv.org/abs/2310.11344v1
- Date: Tue, 17 Oct 2023 15:26:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-18 15:20:59.121686
- Title: The effect of stemming and lemmatization on Portuguese fake news text
classification
- Title(参考訳): ポルトガルの偽ニューステキスト分類におけるステミングと補綴の効果
- Authors: Lucca de Freitas Santos, Murilo Varges da Silva
- Abstract要約: インターネット、スマートフォン、ソーシャルメディアの普及に伴い、情報は迅速かつ容易に拡散されている。
情報の流れが大きくなって、偽情報や偽ニュースを広めようとしている人もいる。
いくつかのテクニックは、テキストデータを扱うときに良い結果に達するのに役立ちます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the popularization of the internet, smartphones and social media,
information is being spread quickly and easily way, which implies bigger
traffic of information in the world, but there is a problem that is harming
society with the dissemination of fake news. With a bigger flow of information,
some people are trying to disseminate deceptive information and fake news. The
automatic detection of fake news is a challenging task because to obtain a good
result is necessary to deal with linguistics problems, especially when we are
dealing with languages that not have been comprehensively studied yet, besides
that, some techniques can help to reach a good result when we are dealing with
text data, although, the motivation of detecting this deceptive information it
is in the fact that the people need to know which information is true and
trustful and which one is not. In this work, we present the effect the
pre-processing methods such as lemmatization and stemming have on fake news
classification, for that we designed some classifier models applying different
pre-processing techniques. The results show that the pre-processing step is
important to obtain betters results, the stemming and lemmatization techniques
are interesting methods and need to be more studied to develop techniques
focused on the Portuguese language so we can reach better results.
- Abstract(参考訳): インターネット, スマートフォン, ソーシャルメディアの普及に伴い, 情報を迅速かつ容易に広めることによって, 世界の情報トラフィックが増大しつつあるが, 偽ニュースの普及によって社会に悪影響を及ぼす問題がある。
情報の流れが大きくなり、偽情報や偽ニュースを広めようとしている人もいる。
The automatic detection of fake news is a challenging task because to obtain a good result is necessary to deal with linguistics problems, especially when we are dealing with languages that not have been comprehensively studied yet, besides that, some techniques can help to reach a good result when we are dealing with text data, although, the motivation of detecting this deceptive information it is in the fact that the people need to know which information is true and trustful and which one is not.
本研究では,葉書化や造語などの前処理手法が偽ニュース分類に与える影響を考察し,異なる前処理手法を適用した分類器モデルを設計した。
その結果,より優れた結果を得るためには,前処理ステップが重要であり,ステムと補間技術は興味深い手法であり,より優れた結果を得るためにはポルトガル語に焦点をあてた技術を開発するためにより研究する必要があることがわかった。
関連論文リスト
- Detection of Human and Machine-Authored Fake News in Urdu [2.013675429941823]
ソーシャルメディアは偽ニュースの拡散を増幅した。
従来の偽ニュース検出手法は、言語的手がかりに依存しているため、効果が低くなる。
精度とロバスト性を改善するため,階層的検出手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T12:42:07Z) - Ethio-Fake: Cutting-Edge Approaches to Combat Fake News in Under-Resourced Languages Using Explainable AI [44.21078435758592]
誤報はコンテンツの作成や拡散が容易なため、急速に広まることがある。
従来のフェイクニュース検出のアプローチは、コンテンツベースの機能にのみ依存することが多い。
本稿では,ソーシャルコンテキストに基づく機能とニュースコンテンツ機能を統合した包括的アプローチを提案する。
論文 参考訳(メタデータ) (2024-10-03T15:49:35Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - fakenewsbr: A Fake News Detection Platform for Brazilian Portuguese [0.6775616141339018]
本稿ではブラジルポルトガル語における偽ニュースの検出に関する総合的研究について述べる。
本稿では、TF-IDFやWord2Vecといった自然言語処理技術を活用する機械学習ベースのアプローチを提案する。
ユーザフレンドリーなWebプラットフォームである fakenewsbr.com を開発し,ニュース記事の妥当性の検証を容易にする。
論文 参考訳(メタデータ) (2023-09-20T04:10:03Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - The use of Data Augmentation as a technique for improving neural network
accuracy in detecting fake news about COVID-19 [0.0]
本稿では,自然言語処理(NLP)とデータ拡張技術の適用により,ニューラルネットワークの性能が向上し,ポルトガル語における偽ニュースの検出が向上することを示す。
論文 参考訳(メタデータ) (2022-05-01T11:52:53Z) - Faking Fake News for Real Fake News Detection: Propaganda-loaded
Training Data Generation [105.20743048379387]
提案手法は,人間によるプロパガンダのスタイルや戦略から情報を得た学習例を生成するための新しいフレームワークである。
具体的には、生成した記事の有効性を確保するために、自然言語推論によって導かれる自己臨界シーケンストレーニングを行う。
実験の結果、PropaNewsでトレーニングされた偽ニュース検知器は、2つの公開データセットで3.62~7.69%のF1スコアで人書きの偽情報を検出するのに優れていることがわかった。
論文 参考訳(メタデータ) (2022-03-10T14:24:19Z) - A Systematic Review on the Detection of Fake News Articles [0.0]
偽ニュースや偽情報の拡散は世界中の社会に脅威をもたらすと論じられている。
この脅威に対処するため、自然言語処理(NLP)アプローチが開発されている。
本稿は,最も性能の高い偽ニュース検出手法の定式化,既存手法による制約の特定,緩和手法の提案を目的とする。
論文 参考訳(メタデータ) (2021-10-18T21:29:11Z) - Detecting Cross-Modal Inconsistency to Defend Against Neural Fake News [57.9843300852526]
我々は、画像やキャプションを含む機械生成ニュースに対して、より現実的で挑戦的な対策を導入する。
敵が悪用できる可能性のある弱点を特定するために、4つの異なる種類の生成された記事からなるNeuralNewsデータセットを作成します。
ユーザ実験から得られた貴重な知見に加えて,視覚的意味的不整合の検出にもとづく比較的効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-16T14:13:15Z) - Machine Learning Explanations to Prevent Overtrust in Fake News
Detection [64.46876057393703]
本研究では、ニュースレビュープラットフォームに組み込んだ説明可能なAIアシスタントが、フェイクニュースの拡散と戦う効果について検討する。
我々は、ニュースレビューと共有インターフェースを設計し、ニュース記事のデータセットを作成し、4つの解釈可能なフェイクニュース検出アルゴリズムを訓練する。
説明可能なAIシステムについてより深く理解するために、説明プロセスにおけるユーザエンゲージメント、メンタルモデル、信頼、パフォーマンス対策の相互作用について議論する。
論文 参考訳(メタデータ) (2020-07-24T05:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。