論文の概要: SemCAFE: When Named Entities make the Difference Assessing Web Source Reliability through Entity-level Analytics
- arxiv url: http://arxiv.org/abs/2504.08776v1
- Date: Thu, 03 Apr 2025 22:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-20 05:34:59.537104
- Title: SemCAFE: When Named Entities make the Difference Assessing Web Source Reliability through Entity-level Analytics
- Title(参考訳): SemCAFE: エンティティレベルの分析を通じてWebソースの信頼性を評価する場合
- Authors: Gautam Kishore Shahi, Oshani Seneviratne, Marc Spaniol,
- Abstract要約: SemCAFEは、その評価にエンティティ関連性を組み込むことで、ニュースの信頼性を検出するように設計されたシステムである。
各ニュース記事のセマンティック指紋を作成することで、SemCAFEは、2022年のロシアによるウクライナ侵攻に関する46,020件と3,407件の信頼できない記事の信頼性を評価することができた。
- 参考スコア(独自算出の注目度): 5.919180820181465
- License:
- Abstract: With the shift from traditional to digital media, the online landscape now hosts not only reliable news articles but also a significant amount of unreliable content. Digital media has faster reachability by significantly influencing public opinion and advancing political agendas. While newspaper readers may be familiar with their preferred outlets political leanings or credibility, determining unreliable news articles is much more challenging. The credibility of many online sources is often opaque, with AI generated content being easily disseminated at minimal cost. Unreliable news articles, particularly those that followed the Russian invasion of Ukraine in 2022, closely mimic the topics and writing styles of credible sources, making them difficult to distinguish. To address this, we introduce SemCAFE, a system designed to detect news reliability by incorporating entity relatedness into its assessment. SemCAFE employs standard Natural Language Processing techniques, such as boilerplate removal and tokenization, alongside entity level semantic analysis using the YAGO knowledge base. By creating a semantic fingerprint for each news article, SemCAFE could assess the credibility of 46,020 reliable and 3,407 unreliable articles on the 2022 Russian invasion of Ukraine. Our approach improved the macro F1 score by 12% over state of the art methods. The sample data and code are available on GitHub
- Abstract(参考訳): 従来のメディアからデジタルメディアへの移行に伴い、オンラインのランドスケープは信頼できるニュース記事だけでなく、膨大な量の信頼できないコンテンツもホストしている。
デジタルメディアは、世論に大きく影響を与え、政治的議題を前進させることにより、より早く到達できる。
新聞読者は政治的傾きや信頼性に詳しいかもしれないが、信頼できないニュース記事の判断の方がずっと難しい。
多くのオンラインソースの信頼性はしばしば不透明であり、AI生成されたコンテンツは最小限のコストで簡単に配布される。
信頼できないニュース記事、特に2022年のロシアによるウクライナ侵攻に続く記事は、信頼できる情報源の話題や書体をよく模倣しており、区別が難しい。
そこで本研究では,その評価にエンティティ関連性を組み込むことで,ニュースの信頼性を検出するシステムであるSemCAFEを紹介する。
SemCAFEは、YAGO知識ベースを用いたエンティティレベルのセマンティック分析と並行して、ボイラプレート除去やトークン化などの標準自然言語処理技術を採用している。
各ニュース記事のセマンティック指紋を作成することで、SemCAFEは、2022年のロシアによるウクライナ侵攻に関する46,020件と3,407件の信頼できない記事の信頼性を評価することができた。
提案手法は,最先端手法よりもマクロF1スコアが12%向上した。
サンプルデータとコードはGitHubで公開されている。
関連論文リスト
- Tracking the Takes and Trajectories of English-Language News Narratives across Trustworthy and Worrisome Websites [4.592124824937116]
我々は、4000以上の事実が信頼できない、混合信頼性があり、事実が信頼できる英語ニュースサイトにおいて、ニュースの物語とその態度を特定し、追跡する。
本研究では, ニュース物語の経路と, 特定のエンティティに対するウェブサイトの姿勢が, ゆがんだプロパガンダネットワークの解明に有効であることを示す。
分散ニュースエコシステムの可視性の向上が,プロパガンダや偽情報の報告や事実確認に役立つことを願っています。
論文 参考訳(メタデータ) (2025-01-15T19:37:44Z) - News and Misinformation Consumption in Europe: A Longitudinal
Cross-Country Perspective [49.1574468325115]
本研究では,欧州4カ国における情報消費について検討した。
フランス、ドイツ、イタリア、イギリスのニュースメディアアカウントから3年間のTwitter活動を分析した。
信頼性のある情報源が情報ランドスケープを支配していることを示しているが、信頼性の低いコンテンツは依然としてすべての国に存在している。
論文 参考訳(メタデータ) (2023-11-09T16:22:10Z) - From Nuisance to News Sense: Augmenting the News with Cross-Document
Evidence and Context [25.870137795858522]
本稿では,複数のニュース記事からの情報を中心的な話題に集め統合するための,新しいセンスメイキングツールと読書インタフェースであるNEWSSENSEを紹介する。
NEWSSENSEは、異なるソースからの関連記事にリンクすることで、ユーザの選択を集中的に根拠づけた記事を強化する。
我々のパイロット研究は、NEWSSENSEがユーザーが重要な情報を識別し、ニュース記事の信頼性を確認し、異なる視点を探索するのに役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-10-06T21:15:11Z) - Bias or Diversity? Unraveling Fine-Grained Thematic Discrepancy in U.S.
News Headlines [63.52264764099532]
われわれは、2014年から2022年までの米国の主要メディアから、180万件のニュース記事の大規模なデータセットを使用している。
我々は、国内政治、経済問題、社会問題、外交の4つの主要なトピックに関連する、きめ細かいテーマの相違を定量化する。
以上の結果から,国内政治や社会問題においては,一定のメディア偏見が原因であることが示唆された。
論文 参考訳(メタデータ) (2023-03-28T03:31:37Z) - Unveiling the Hidden Agenda: Biases in News Reporting and Consumption [59.55900146668931]
イタリアのワクチン論争に関する6年間のデータセットを構築し、物語と選択バイアスを特定するためにベイジアン潜在空間モデルを採用する。
バイアスとエンゲージメントの間に非線形な関係が見られ、極端な位置へのエンゲージメントが高くなった。
Twitter上でのニュース消費の分析は、同様のイデオロギー的な立場のニュースメディアの間で、一般的なオーディエンスを明らかにしている。
論文 参考訳(メタデータ) (2023-01-14T18:58:42Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Stance Detection with BERT Embeddings for Credibility Analysis of
Information on Social Media [1.7616042687330642]
本稿では,記事の内容とともに,その特徴の1つとして姿勢を用いた偽ニュースを検出するモデルを提案する。
本研究は,自動的特徴抽出とテキストの関連性でコンテンツを解釈する。
実世界のデータセットで行った実験は、我々のモデルが以前の研究より優れており、95.32%の精度で偽ニュースの検出を可能にすることを示している。
論文 参考訳(メタデータ) (2021-05-21T10:46:43Z) - Misinfo Belief Frames: A Case Study on Covid & Climate News [49.979419711713795]
読者がニュースの信頼性や誤った情報の影響をどのように認識するかを理解するための形式主義を提案する。
23.5kの見出しに66kの推論データセットであるMisinfo Belief Frames (MBF) corpusを紹介する。
大規模言語モデルを用いて誤情報フレームを予測した結果,機械生成推論がニュース見出しに対する読者の信頼に影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2021-04-18T09:50:11Z) - Supporting verification of news articles with automated search for
semantically similar articles [0.0]
偽ニュースを扱うための証拠検索手法を提案する。
学習課題は教師なし機械学習問題として定式化される。
われわれのアプローチは、コンセプトドリフトとは無関係である。
機械学習タスクはテキスト内の仮説とは独立している。
論文 参考訳(メタデータ) (2021-03-29T12:56:59Z) - A Survey on Predicting the Factuality and the Bias of News Media [29.032850263311342]
「事実と偏見のためのメディアプロファイリングの現状」
「西洋政治の背景にある政治的偏見検出は、左中右偏見の予測である」
「異なる情報源とモダリティの使用の最近の進歩」
論文 参考訳(メタデータ) (2021-03-16T11:11:54Z) - Political audience diversity and news reliability in algorithmic ranking [54.23273310155137]
本稿では,ウェブサイトのオーディエンスの政治的多様性を質の指標として活用することを提案する。
ドメインの専門家によるニュースソースの信頼性評価と6,890人の米国市民の多様なサンプルによるWebブラウジングデータを用いて、より極端な、政治的に多様性の低いWebサイトが、ジャーナリストの基準を低くしていることを示す。
論文 参考訳(メタデータ) (2020-07-16T02:13:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。