Fugu-MT 論文翻訳(概要): Lost in Translation -- Multilingual Misinformation and its Evolution

論文の概要: Lost in Translation -- Multilingual Misinformation and its Evolution

arxiv url: http://arxiv.org/abs/2310.18089v1
Date: Fri, 27 Oct 2023 12:21:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-30 13:57:10.559172
Title: Lost in Translation -- Multilingual Misinformation and its Evolution
Title（参考訳）: los in translation --多言語誤情報とその進化
Authors: Dorian Quelle, Calvin Cheng, Alexandre Bovet, Scott A. Hale
Abstract要約: 本稿では,95言語にまたがる25万以上のファクトチェックの分析を通じて,多言語誤報の頻度とダイナミクスについて検討する。誤報のクレームの大部分は1回だけ事実チェックされているが、21,000件以上のクレームに対応する11.7%は複数回チェックされている。誤情報拡散のプロキシとしてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が見つかる。
参考スコア（独自算出の注目度）: 52.07628580627591
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Misinformation and disinformation are growing threats in the digital age, spreading rapidly across languages and borders. This paper investigates the prevalence and dynamics of multilingual misinformation through an analysis of over 250,000 unique fact-checks spanning 95 languages. First, we find that while the majority of misinformation claims are only fact-checked once, 11.7%, corresponding to more than 21,000 claims, are checked multiple times. Using fact-checks as a proxy for the spread of misinformation, we find 33% of repeated claims cross linguistic boundaries, suggesting that some misinformation permeates language barriers. However, spreading patterns exhibit strong homophily, with misinformation more likely to spread within the same language. To study the evolution of claims over time and mutations across languages, we represent fact-checks with multilingual sentence embeddings and cluster semantically similar claims. We analyze the connected components and shortest paths connecting different versions of a claim finding that claims gradually drift over time and undergo greater alteration when traversing languages. Overall, this novel investigation of multilingual misinformation provides key insights. It quantifies redundant fact-checking efforts, establishes that some claims diffuse across languages, measures linguistic homophily, and models the temporal and cross-lingual evolution of claims. The findings advocate for expanded information sharing between fact-checkers globally while underscoring the importance of localized verification.
Abstract（参考訳）: 誤情報や偽情報はデジタル時代に脅威を増し、言語や国境を越えて急速に広まっている。本稿では,95言語にまたがる25万以上のファクトチェックを分析し,多言語誤報の頻度とダイナミクスについて検討する。まず、誤情報のクレームの大半は1回だけ事実チェックされているが、21,000以上のクレームに対応する11.7%は複数回チェックされている。誤情報拡散の指標としてファクトチェックを用いると、言語境界を越えて繰り返し主張する主張の33%が言語障壁に浸透していることが示唆される。しかし、拡散パターンは強い相同性を示し、誤情報が同じ言語内で広まる傾向が強い。言語間のクレームの進化と変異を研究するために,多言語文の埋め込みとクラスタのセマンティックな類似クレームを用いてファクトチェックを表現する。我々は,異なる種類のクレームを接続する連結コンポーネントと最短パスを分析し,クレームが徐々に時間とともに移動し,言語を横断する際に大きな変化を起こすことを示す。全体として、この新しい多言語誤情報の調査は重要な洞察を与える。余分な事実チェックの努力を定量化し、いくつかの主張が言語間で拡散し、言語的ホモフィリーを測り、クレームの時間的および言語的進化をモデル化する。本研究は,局所的検証の重要性を強調しつつ,ファクトチェッカー間の情報共有の拡大を提唱するものである。

関連論文リスト

When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.230355403478995]
本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文参考訳（メタデータ） (2026-01-30T11:23:01Z)
Rethinking Cross-lingual Gaps from a Statistical Viewpoint [24.938886584535926]
大きな言語モデル(LLM)は、ソース言語からの知識を取得し、ターゲット言語からのクエリ時にアクセス可能にすることで、ブリッジとして機能する。これまでの研究では、言語間ギャップ(viz.)が指摘されており、クエリがソース言語にある場合と比較して、ターゲット言語で知識がクエリされた場合の精度の低下である。対象言語における応答のばらつきが,このギャップの主な原因であると仮定する。
論文参考訳（メタデータ） (2025-10-17T11:34:04Z)
Tracing Multilingual Factual Knowledge Acquisition in Pretraining [62.95057983661562]
大規模言語モデル(LLM)は、事前学習データに存在する多言語事実知識をリコールすることができる。我々は,OLMo-7Bに焦点をあてて,事前学習中に現実のリコールと言語間の整合性がどのように進化するかを辿った。ほとんどの言語では、正確性と一貫性が時間の経過とともに向上していることが分かりました。
論文参考訳（メタデータ） (2025-05-20T18:39:56Z)
Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models [49.16690802656554]
複数の言語で意味論的に等価なプロンプトに対して一貫した応答を提供するのに、多言語の事実モデルでは苦労していることがわかった。最終層での計算をバイパスし,予測精度と言語間の整合性を向上する線形ショートカット手法を提案する。
論文参考訳（メタデータ） (2025-04-05T19:43:10Z)
Large Language Models for Multilingual Previously Fact-Checked Claim Detection [3.694429692322632]
本稿では,複数言語による事実チェックによるクレーム検出のための大規模言語モデル (LLM) の総合評価について述べる。 20言語にまたがる7つのLLMをモノリンガル・クロスリンガル・セッティングで評価する。この結果から,LLMは高リソース言語ではよく機能するが,低リソース言語では苦戦していることがわかった。
論文参考訳（メタデータ） (2025-03-04T15:56:43Z)
A Comparative Study of Translation Bias and Accuracy in Multilingual Large Language Models for Cross-Language Claim Verification [1.566834021297545]
本研究は,言語間クレーム検証における翻訳バイアスと大規模言語モデルの有効性を体系的に評価する。本稿では,事前翻訳と自己翻訳の2つの異なる翻訳手法について検討する。その結果,低リソース言語では表現不足による直接推論の精度が著しく低いことが明らかとなった。
論文参考訳（メタデータ） (2024-10-14T09:02:42Z)
Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文参考訳（メタデータ） (2024-10-05T20:40:49Z)
Claim Detection for Automated Fact-checking: A Survey on Monolingual, Multilingual and Cross-Lingual Research [7.242609314791262]
本稿では,現状の多言語クレーム検出研究を,問題の3つの重要な要因,妥当性,優先性,類似性に分類する。本稿では,既存の多言語データセットの概要と課題について概説し,今後の発展の可能性を提案する。
論文参考訳（メタデータ） (2024-01-22T14:17:03Z)
Multi-EuP: The Multilingual European Parliament Dataset for Analysis of Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文参考訳（メタデータ） (2023-11-03T12:29:11Z)
Breaking Language Barriers with MMTweets: Advancing Cross-Lingual Debunked Narrative Retrieval for Fact-Checking [5.880794128275313]
言語横断的な物語検索は未検討の問題である。本研究は, 言語間分離された物語検索を導入し, (i)多言語誤報ツイート(MMTweets)を作成することにより, この研究ギャップに対処する。 MMTweetsは、言語間のペア、画像、人間のアノテーション、きめ細かいラベルを特徴としている。 MMTweetsは言語横断的な物語検索の課題を示し,検索モデルの改善領域を強調している。
論文参考訳（メタデータ） (2023-08-10T16:33:17Z)
CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文参考訳（メタデータ） (2022-09-05T17:36:14Z)
Matching Tweets With Applicable Fact-Checks Across Languages [27.762055254009017]
ソーシャルメディア投稿(ツイート)のクレームに対する既存のファクトチェックを自動的に見つけることに重点を置いています。モノリンガル(英語のみ)、マルチリンガル(スペイン語、ポルトガル語)、クロスリンガル(ヒンディー語-英語)の設定において、分類と検索の両方の実験を行う。 4つの言語対における「マッチ」分類(平均精度93%)の有望な結果を示す。
論文参考訳（メタデータ） (2022-02-14T23:33:02Z)
Multilingual Evidence Retrieval and Fact Verification to Combat Global Disinformation: The Power of Polyglotism [0.0]
本稿は,多言語証拠の検索と事実検証を,世界的不正情報対策のステップとして検討する。目標は、エビデンス豊かな言語で検索し、エビデンス不足言語でクレームを検証する多言語システムを構築することである。
論文参考訳（メタデータ） (2020-12-16T13:10:56Z)
Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文参考訳（メタデータ） (2020-05-02T04:34:37Z)
Bridging Linguistic Typology and Multilingual Machine Translation with Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。我々の表現は類型学を組み込み、言語関係と相関関係を強化する。次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文参考訳（メタデータ） (2020-04-30T16:25:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。