論文の概要: A Multi-Label Dataset of French Fake News: Human and Machine Insights
- arxiv url: http://arxiv.org/abs/2403.16099v2
- Date: Thu, 11 Apr 2024 09:58:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 18:16:14.917610
- Title: A Multi-Label Dataset of French Fake News: Human and Machine Insights
- Title(参考訳): フレンチフェイクニュースのマルチラベルデータセット:人間とマシンインサイト
- Authors: Benjamin Icard, François Maine, Morgane Casanova, Géraud Faye, Julien Chanson, Guillaume Gadek, Ghislain Atemezing, François Bancilhon, Paul Égré,
- Abstract要約: 専門機関が信頼できないと思われる17のフランスの報道機関から選抜された100の文書のコーパスOBSINFOXを提示する。
通常よりも多くのラベルを収集することで、人間が偽ニュースの特徴と見なす特徴を特定できる。
コーパスにおける風刺文の有病率を示すGate Cloudを用いたトピックスとジャンル分析について述べる。
- 参考スコア(独自算出の注目度): 0.5533610982157059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a corpus of 100 documents, OBSINFOX, selected from 17 sources of French press considered unreliable by expert agencies, annotated using 11 labels by 8 annotators. By collecting more labels than usual, by more annotators than is typically done, we can identify features that humans consider as characteristic of fake news, and compare them to the predictions of automated classifiers. We present a topic and genre analysis using Gate Cloud, indicative of the prevalence of satire-like text in the corpus. We then use the subjectivity analyzer VAGO, and a neural version of it, to clarify the link between ascriptions of the label Subjective and ascriptions of the label Fake News. The annotated dataset is available online at the following url: https://github.com/obs-info/obsinfox Keywords: Fake News, Multi-Labels, Subjectivity, Vagueness, Detail, Opinion, Exaggeration, French Press
- Abstract(参考訳): 専門機関が信頼できないとみなす17の報道機関から選抜された100の文書のコーパスであるOBSINFOXを8のアノテーションで11のラベルで注釈付けした。
通常よりも多くのラベルを集め、通常よりも多くのアノテータによって、人間が偽ニュースの特徴と見なす特徴を特定し、それらを自動分類器の予測と比較することができる。
コーパスにおける風刺文の有病率を示すGate Cloudを用いたトピックスとジャンル分析について述べる。
次に、主観分析器VAGOと、そのニューラルバージョンを用いて、ラベルの主観的記述とラベルのFake Newsの属性の関連を明らかにする。
注釈付きデータセットは以下のURLでオンラインで公開されている。 https://github.com/obs-info/obsinfox Keywords: Fake News, Multi-Labels, Subjectivity, Vagueness, Detail, Opinion, Exaggeration, French Press
関連論文リスト
- FineFake: A Knowledge-Enriched Dataset for Fine-Grained Multi-Domain Fake News Detection [54.37159298632628]
FineFakeは、フェイクニュース検出のためのマルチドメイン知識強化ベンチマークである。
FineFakeは6つのセマンティックトピックと8つのプラットフォームにまたがる16,909のデータサンプルを含んでいる。
FineFakeプロジェクト全体がオープンソースリポジトリとして公開されている。
論文 参考訳(メタデータ) (2024-03-30T14:39:09Z) - Exposing propaganda: an analysis of stylistic cues comparing human
annotations and machine classification [0.7749297275724032]
本稿では,プロパガンダの言語とそのスタイル的特徴について検討する。
プロパガンダソースとして特定されたウェブサイトから抽出されたニュース記事からなるPPNデータセットを提示する。
我々は,アノテーションが使用する手がかりを識別するために異なるNLP手法を提案し,それらを機械分類と比較した。
論文 参考訳(メタデータ) (2024-02-06T07:51:54Z) - Gen-Z: Generative Zero-Shot Text Classification with Contextualized
Label Descriptions [50.92702206798324]
ゼロショットテキスト分類のための生成的プロンプトフレームワークを提案する。
GEN-Zはラベルの自然言語記述に基づく入力テキストのLM可能性を測定する。
データソースの文脈化によるゼロショット分類は、ゼロショットベースラインと少数ショットベースラインの両方を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2023-11-13T07:12:57Z) - Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - It's All in the Embedding! Fake News Detection Using Document Embeddings [0.6091702876917281]
本稿では,文書埋め込みを用いて,ニュース記事を信頼性やニセモノと正確にラベル付けする複数のモデルを構築する手法を提案する。
また、バイナリや複数ラベルの分類を用いて偽ニュースを検出する異なるアーキテクチャのベンチマークを示す。
論文 参考訳(メタデータ) (2023-04-16T13:30:06Z) - FreCDo: A Large Corpus for French Cross-Domain Dialect Identification [22.132457694021184]
本稿では,413,522のフランス語テキストサンプルからなるフランス語方言識別のための新しいコーパスを提案する。
トレーニング、検証、テストの分割は、異なるニュースウェブサイトから収集される。
これはフランスのクロスドメイン(FreCDo)の方言識別タスクにつながります。
論文 参考訳(メタデータ) (2022-12-15T10:32:29Z) - Predictive linguistic cues for fake news: a societal artificial
intelligence problem [9.40467099889021]
メディアニュース項目の言語的特徴を,機械学習アルゴリズムを用いて,偽ニュースと実ニュースを区別する。
我々は、証拠ではなく、主に分布特性を制御するニューラルネットワークを使用している。
測定値に高い値を持つ特徴, 負, 正, 基数は, 曲線 (AUC) とF1スコアの下で高い面積を提供するために観測される。
論文 参考訳(メタデータ) (2022-11-26T07:50:01Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Label Noise-Resistant Mean Teaching for Weakly Supervised Fake News
Detection [93.6222609806278]
本稿では,弱い教師付き偽ニュース検出のためのラベル雑音耐性平均教育手法 (LNMT) を提案する。
LNMTは、未ラベルのニュースとユーザのフィードバックコメントを活用して、トレーニングデータの量を増やす。
LNMTはラベル伝搬とラベル信頼性推定を備えた平均教師フレームワークを確立する。
論文 参考訳(メタデータ) (2022-06-10T16:01:58Z) - A Heuristic-driven Uncertainty based Ensemble Framework for Fake News
Detection in Tweets and News Articles [5.979726271522835]
ニュース項目が「本物」か「偽」かを自動的に識別する新しい偽ニュース検出システムについて述べる。
我々は,事前学習したモデルと統計的特徴融合ネットワークからなるアンサンブルモデルを用いた。
提案手法は,分類タスクの適切なクラス出力信頼度レベルとともに,信頼性の高い予測不確実性を定量化した。
論文 参考訳(メタデータ) (2021-04-05T06:35:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。