論文の概要: Lost in Translation -- Multilingual Misinformation and its Evolution
- arxiv url: http://arxiv.org/abs/2310.18089v1
- Date: Fri, 27 Oct 2023 12:21:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-30 13:57:10.559172
- Title: Lost in Translation -- Multilingual Misinformation and its Evolution
- Title(参考訳): los in translation --多言語誤情報とその進化
- Authors: Dorian Quelle, Calvin Cheng, Alexandre Bovet, Scott A. Hale
- Abstract要約: 本稿では,95言語にまたがる25万以上のファクトチェックの分析を通じて,多言語誤報の頻度とダイナミクスについて検討する。
誤報のクレームの大部分は1回だけ事実チェックされているが、21,000件以上のクレームに対応する11.7%は複数回チェックされている。
誤情報拡散のプロキシとしてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が見つかる。
- 参考スコア(独自算出の注目度): 52.07628580627591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Misinformation and disinformation are growing threats in the digital age,
spreading rapidly across languages and borders. This paper investigates the
prevalence and dynamics of multilingual misinformation through an analysis of
over 250,000 unique fact-checks spanning 95 languages. First, we find that
while the majority of misinformation claims are only fact-checked once, 11.7%,
corresponding to more than 21,000 claims, are checked multiple times. Using
fact-checks as a proxy for the spread of misinformation, we find 33% of
repeated claims cross linguistic boundaries, suggesting that some
misinformation permeates language barriers. However, spreading patterns exhibit
strong homophily, with misinformation more likely to spread within the same
language. To study the evolution of claims over time and mutations across
languages, we represent fact-checks with multilingual sentence embeddings and
cluster semantically similar claims. We analyze the connected components and
shortest paths connecting different versions of a claim finding that claims
gradually drift over time and undergo greater alteration when traversing
languages. Overall, this novel investigation of multilingual misinformation
provides key insights. It quantifies redundant fact-checking efforts,
establishes that some claims diffuse across languages, measures linguistic
homophily, and models the temporal and cross-lingual evolution of claims. The
findings advocate for expanded information sharing between fact-checkers
globally while underscoring the importance of localized verification.
- Abstract(参考訳): 誤情報や偽情報はデジタル時代に脅威を増し、言語や国境を越えて急速に広まっている。
本稿では,95言語にまたがる25万以上のファクトチェックを分析し,多言語誤報の頻度とダイナミクスについて検討する。
まず、誤情報のクレームの大半は1回だけ事実チェックされているが、21,000以上のクレームに対応する11.7%は複数回チェックされている。
誤情報拡散の指標としてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が言語障壁に浸透していることが示唆される。
しかし、拡散パターンは強い相同性を示し、誤情報が同じ言語内で広まる傾向が強い。
言語間のクレームの進化と変異を研究するために,多言語文の埋め込みとクラスタのセマンティックな類似クレームを用いてファクトチェックを表現する。
我々は,異なる種類のクレームを接続する連結コンポーネントと最短パスを分析し,クレームが徐々に時間とともに移動し,言語を横断する際に大きな変化を起こすことを示す。
全体として、この新しい多言語誤情報の調査は重要な洞察を与える。
余分な事実チェックの努力を定量化し、いくつかの主張が言語間で拡散し、言語的ホモフィリーを測り、クレームの時間的および言語的進化をモデル化する。
本研究は,局所的検証の重要性を強調しつつ,ファクトチェッカー間の情報共有の拡大を提唱するものである。
関連論文リスト
- Claim Detection for Automated Fact-checking: A Survey on Monolingual,
Multilingual and Cross-Lingual Research [8.556183465416156]
本稿では,現状の多言語クレーム検出研究を,問題の3つの重要な要因,妥当性,優先性,類似性に分類する。
本稿では,既存の多言語データセットの概要と課題について概説し,今後の発展の可能性を提案する。
論文 参考訳(メタデータ) (2024-01-22T14:17:03Z) - Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Multilingual Previously Fact-Checked Claim Retrieval [1.4884363206251627]
本稿では,ファクトチェックされたクレーム検索のための多言語データセットであるMultiClaimを提案する。
ソーシャルメディアから27言語28k、プロのファクトチェッカーが書いた39言語206kのファクトチェックを収集しました。
我々は、このデータセットとその様々な次元において、異なる教師なしの手法がいかに相応しいかを評価した。
論文 参考訳(メタデータ) (2023-05-13T20:00:18Z) - Cross-lingual Transfer Learning for Check-worthy Claim Identification
over Twitter [7.601937548486356]
ソーシャルメディアに拡散する誤報は、疑わしいインフォデミックになっている。
本稿では,多言語BERT(mBERT)モデルを用いて,5つの多言語対をまたいだ言語間チェックハーネス推定のための6つの手法を体系的に検討する。
以上の結果から,いくつかの言語対では,ゼロショットの言語間移動が可能であり,対象言語で訓練された単言語モデルに匹敵する性能が得られた。
論文 参考訳(メタデータ) (2022-11-09T18:18:53Z) - CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual
Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。
クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。
提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文 参考訳(メタデータ) (2022-09-05T17:36:14Z) - Matching Tweets With Applicable Fact-Checks Across Languages [27.762055254009017]
ソーシャルメディア投稿(ツイート)のクレームに対する既存のファクトチェックを自動的に見つけることに重点を置いています。
モノリンガル(英語のみ)、マルチリンガル(スペイン語、ポルトガル語)、クロスリンガル(ヒンディー語-英語)の設定において、分類と検索の両方の実験を行う。
4つの言語対における「マッチ」分類(平均精度93%)の有望な結果を示す。
論文 参考訳(メタデータ) (2022-02-14T23:33:02Z) - Multilingual Evidence Retrieval and Fact Verification to Combat Global
Disinformation: The Power of Polyglotism [0.0]
本稿は,多言語証拠の検索と事実検証を,世界的不正情報対策のステップとして検討する。
目標は、エビデンス豊かな言語で検索し、エビデンス不足言語でクレームを検証する多言語システムを構築することである。
論文 参考訳(メタデータ) (2020-12-16T13:10:56Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。