論文の概要: Uncertainty-Aware Estimation of Mis/Disinformation Prevalence on Social Media
- arxiv url: http://arxiv.org/abs/2603.11058v1
- Date: Tue, 03 Mar 2026 22:04:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.487863
- Title: Uncertainty-Aware Estimation of Mis/Disinformation Prevalence on Social Media
- Title(参考訳): ソーシャルメディアにおけるミス/偽情報の頻度の不確実性評価
- Authors: Ishari Amarasinghe, Salvatore Romano, Jacopo Amidei, Emmanuel M. Vincent, Andreas Kaltenbrunner,
- Abstract要約: 本稿では,信頼区間を用いて,誤報・誤報の頻度に関する不確実性を定量化する手法を提案する。
データは2025年3月から4月にかけて、Facebook、Instagram、LinkedIn、TikTok、X/Twitter、YouTubeから収集された。
i) サンプルの不確実性, (ii) 人間の不一致と誤分類に起因するアノテーションの不確実性, (iii) キーワードベースのデータ収集によって引き起こされるデータ検索の不確実性。
- 参考スコア(独自算出の注目度): 0.6769127514113163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimation of mis/disinformation prevalence in social media is crucial for designing mitigation strategies to limit its impact. Yet, such estimations are subject to several uncertainties that are rarely quantified jointly. In this study, we present a methodological contribution in which confidence intervals were used to quantify uncertainties related to mis/disinformation prevalence. The analysis draws on a multi-platform, multilingual dataset annotated by professional fact-checkers. Data were collected between March and April 2025 from Facebook, Instagram, LinkedIn, TikTok, X/Twitter, and YouTube across four EU Member States (France, Poland, Slovakia, and Spain). We account for different causes of uncertainty: (i) sample uncertainty, (ii) annotation uncertainty arising from human disagreement and misclassification, and (iii) data retrieval uncertainty induced by keyword-based data collection. First, we estimate the uncertainty arising from the different causes separately using confidence intervals, simulation-based methods, and bootstrapping. Finally, we combined multinomial simulations of annotator behaviour with keyword and post-resampling to capture the joint impact of measurement uncertainty on mis/disinformation prevalence estimates. The proposed methodological approach highlights the importance of uncertainty-aware estimation of mis/disinformation prevalence for robust analysis. The empirical results of this study show that keyword-based data retrieval can exceed baseline variability, leading to wider confidence intervals around prevalence estimates.
- Abstract(参考訳): ソーシャルメディアにおける誤情報頻度の推定は、その影響を制限するために緩和戦略を設計するために不可欠である。
しかし、そのような推定は、共同で定量化されることが滅多にないいくつかの不確実性にさらされる。
本研究では,信頼区間を用いて,誤報・誤報の頻度に関する不確実性を定量化する手法を提案する。
この分析は、プロのファクトチェッカーによって注釈付けされたマルチプラットフォーム多言語データセットに基づいて行われる。
データは2025年3月から4月にかけて、Facebook、Instagram、LinkedIn、TikTok、X/Twitter、YouTubeの4つのEU加盟国(フランス、ポーランド、スロバキア、スペイン)から収集された。
私たちは様々な不確実性の原因を説明します。
(i)サンプルの不確かさ。
二 人間の不一致及び誤分類による不確実性
三 キーワードに基づくデータ収集によって引き起こされたデータ検索の不確実性
まず、信頼区間、シミュレーションに基づく手法、ブートストラップを用いて、異なる原因から生じる不確実性を別々に推定する。
最後に,アノテータ動作の多項シミュレーションとキーワードとポストサンプリングを組み合わせることで,測定の不確実性が誤情報/偽情報の有病率推定に与える影響を把握した。
提案手法は,ロバスト解析における誤り/偽情報の頻度の不確実性を考慮した評価の重要性を強調した。
本研究では,キーワードに基づくデータ検索がベースラインの変動を超越し,有病率推定の周囲の信頼区間がより広くなることを示す。
関連論文リスト
- Uncertainty-Aware Data-Efficient AI: An Information-Theoretic Perspective [48.073471560778984]
ロボット工学、電気通信、医療といったコンテキスト固有のアプリケーションでは、人工知能システムは訓練データに制限があるという課題に直面していることが多い。
本稿では,2つの相補的手法を用いて,データ制限体制に対処する形式的手法について検討する。
論文 参考訳(メタデータ) (2025-12-04T21:44:22Z) - Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Temporal Distribution Shift in Real-World Pharmaceutical Data: Implications for Uncertainty Quantification in QSAR Models [1.9354018523009415]
機械学習モデルにおける予測の不確実性を推定するいくつかの計算ツールが存在する。
I. I. D. 設定からの逸脱は これらの不確実な定量化方法のパフォーマンスを損なうことが示されている。
我々は,不確実性評価手法の総合的,大規模評価の必要性に対処するために,現実世界の医薬品データセットを用いている。
論文 参考訳(メタデータ) (2025-02-06T11:26:04Z) - Probabilistic Modeling of Disparity Uncertainty for Robust and Efficient Stereo Matching [61.73532883992135]
本稿では,新しい不確実性を考慮したステレオマッチングフレームワークを提案する。
我々はベイズリスクを不確実性の測定として採用し、データを別々に見積もり、不確実性をモデル化する。
論文 参考訳(メタデータ) (2024-12-24T23:28:20Z) - From Risk to Uncertainty: Generating Predictive Uncertainty Measures via Bayesian Estimation [5.355925496689674]
私たちは、異なる予測の不確実性対策を作成できるフレームワークを構築します。
本手法は,分布外および誤分類インスタンスの検出において,その性能を評価することにより,画像データセット上での検証を行う。
論文 参考訳(メタデータ) (2024-02-16T14:40:22Z) - One step closer to unbiased aleatoric uncertainty estimation [71.55174353766289]
そこで本研究では,観測データのアクティブデノイズ化による新しい推定手法を提案する。
幅広い実験を行うことで,提案手法が標準手法よりも実際のデータ不確実性にはるかに近い近似を与えることを示す。
論文 参考訳(メタデータ) (2023-12-16T14:59:11Z) - Ambiguity Meets Uncertainty: Investigating Uncertainty Estimation for
Word Sense Disambiguation [5.55197751179213]
既存の教師付き手法は、WSDを分類タスクとして扱い、優れたパフォーマンスを実現した。
本稿では,WSD 向けに設計されたベンチマークにおける不確実性推定(UE)を広範囲に研究する。
本研究では, モデルが適切に設計されたテストシナリオにおいて, 選択されたUEスコアを用いて, モデルによるデータとモデルの不確実性を捕捉する能力について検討し, モデルの不確実性を十分に反映するが, モデルの不確実性を過小評価する。
論文 参考訳(メタデータ) (2023-05-22T15:18:15Z) - Uncertainty Quantification in Extreme Learning Machine: Analytical
Developments, Variance Estimates and Confidence Intervals [0.0]
不確かさの定量化は、機械学習モデルの予測品質を評価するために不可欠である。
文献で提案されるほとんどの手法は、データに対して強い仮定を行い、入力重みのランダム性を無視したり、信頼区間推定におけるバイアス寄与を無視したりする。
本稿では,これらの制約を克服し,EMMの多様性の理解を向上させる新しい推定法を提案する。
論文 参考訳(メタデータ) (2020-11-03T13:45:59Z) - The Aleatoric Uncertainty Estimation Using a Separate Formulation with
Virtual Residuals [51.71066839337174]
既存の手法では、ターゲット推定における誤差を定量化できるが、過小評価する傾向がある。
本稿では,信号とその不確かさを推定するための新たな分離可能な定式化を提案し,オーバーフィッティングの影響を回避した。
提案手法は信号および不確実性推定のための最先端技術より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T12:11:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。