論文の概要: SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval
- arxiv url: http://arxiv.org/abs/2505.10740v1
- Date: Thu, 15 May 2025 23:04:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.760246
- Title: SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval
- Title(参考訳): SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval
- Authors: Qiwei Peng, Robert Moro, Michal Gregor, Ivan Srba, Simon Ostermann, Marian Simko, Juraj Podroužek, Matúš Mesarčík, Jaroslav Kopčan, Anders Søgaard,
- Abstract要約: オンラインの偽情報の普及は世界的な課題であり、機械学習は潜在的な解決策として広く研究されてきた。
このギャップに対処するため,SemEval 2025において多言語クレーム検索の共有タスクを行った。
両サブトラックにまたがる最良性能システムと、最も一般的かつ最も効果的なアプローチについて報告する。
- 参考スコア(独自算出の注目度): 29.85035370846946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid spread of online disinformation presents a global challenge, and machine learning has been widely explored as a potential solution. However, multilingual settings and low-resource languages are often neglected in this field. To address this gap, we conducted a shared task on multilingual claim retrieval at SemEval 2025, aimed at identifying fact-checked claims that match newly encountered claims expressed in social media posts across different languages. The task includes two subtracks: (1) a monolingual track, where social posts and claims are in the same language, and (2) a crosslingual track, where social posts and claims might be in different languages. A total of 179 participants registered for the task contributing to 52 test submissions. 23 out of 31 teams have submitted their system papers. In this paper, we report the best-performing systems as well as the most common and the most effective approaches across both subtracks. This shared task, along with its dataset and participating systems, provides valuable insights into multilingual claim retrieval and automated fact-checking, supporting future research in this field.
- Abstract(参考訳): オンラインの偽情報の普及は世界的な課題であり、機械学習は潜在的な解決策として広く研究されてきた。
しかし、この分野では多言語設定や低リソース言語は無視されることが多い。
このギャップに対処するため,我々はSemEval 2025で多言語クレーム検索の共有タスクを行い,さまざまな言語にまたがるソーシャルメディア投稿に新たに現れたクレームと一致するファクトチェックされたクレームを同定した。
この課題には,(1) 同一言語にソーシャルポストとクレームがあるモノリンガルトラック,(2) 異なる言語にソーシャルポストとクレームが存在するかもしれないクロスリンガルトラックの2つのサブトラックが含まれる。
このタスクに登録された参加者は合計179人であり、52の試験応募に貢献した。
31チーム中23チームがシステム論文を提出した。
本稿では,両サブトラックにまたがる最良性能システムと,最も一般的かつ効果的なアプローチについて報告する。
この共有タスクは、データセットや参加システムとともに、多言語クレーム検索と自動ファクトチェックに関する貴重な洞察を提供し、この分野における将来の研究を支援する。
関連論文リスト
- Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task [73.35882908048423]
Retrieval-augmented Generation (RAG) は現代のNLPの基盤となっている。
本稿では,複数言語にまたがるRAGの有効性について,複数言語にまたがるオープンドメイン問合せに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-04T17:35:43Z) - Entity-aware Cross-lingual Claim Detection for Automated Fact-checking [7.242609314791262]
Ex-Claimは,任意の言語で記述されたクレームの処理をうまく一般化する,エンティティ対応の言語間クレーム検出モデルである。
提案手法は,27言語にまたがるベースラインを著しく上回り,限られた学習データであっても,最も高い知識伝達率を達成する。
論文 参考訳(メタデータ) (2025-03-19T14:00:55Z) - Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval [0.7874708385247352]
本稿では,SemEval 2025 Task 7:以前のFact-Checked Claim Retrievalについて述べる。
このタスクは、広範囲な多言語MultiClaimデータセットから与えられた入力クレームに関する関連する事実チェックを取得する必要がある。
最適なモデルでは,クロスリンガルデータでは85%,モノリンガルデータでは92%の精度が得られた。
論文 参考訳(メタデータ) (2025-03-12T02:59:41Z) - GenAI Content Detection Task 1: English and Multilingual Machine-Generated Text Detection: AI vs. Human [71.42669028683741]
我々は,Coling 2025におけるGenAIワークショップの一環として,バイナリマシン生成テキスト検出における共有タスクを提案する。
このタスクは、モノリンガル(英: Monolingual)とマルチリンガル(英: Multilingual)の2つのサブタスクから構成される。
本稿では,データの包括的概要,結果の概要,参加システムの詳細な説明,提出内容の詳細な分析について述べる。
論文 参考訳(メタデータ) (2025-01-19T11:11:55Z) - Findings of the IWSLT 2024 Evaluation Campaign [102.7608597658451]
本稿は、第21回IWSLT会議によって組織された共有タスクについて報告する。
共通タスクは、音声翻訳における7つの科学的課題に対処する。
論文 参考訳(メタデータ) (2024-11-07T19:11:55Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - Matching Tweets With Applicable Fact-Checks Across Languages [27.762055254009017]
ソーシャルメディア投稿(ツイート)のクレームに対する既存のファクトチェックを自動的に見つけることに重点を置いています。
モノリンガル(英語のみ)、マルチリンガル(スペイン語、ポルトガル語)、クロスリンガル(ヒンディー語-英語)の設定において、分類と検索の両方の実験を行う。
4つの言語対における「マッチ」分類(平均精度93%)の有望な結果を示す。
論文 参考訳(メタデータ) (2022-02-14T23:33:02Z) - UPV at CheckThat! 2021: Mitigating Cultural Differences for Identifying
Multilingual Check-worthy Claims [6.167830237917659]
本稿では,意図しないバイアスを軽減するための補助課題として,言語識別タスクを提案する。
その結果,言語識別とチェックアワーなクレーム検出タスクを併用することで,選択した言語の性能向上が期待できることがわかった。
論文 参考訳(メタデータ) (2021-09-19T21:46:16Z) - XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating
Cross-lingual Generalization [128.37244072182506]
言語間TRansfer Evaluation of Multilinguals XTREMEは、40言語および9タスクにわたる多言語表現の言語間一般化能力を評価するためのベンチマークである。
我々は、英語でテストされたモデルは、多くのタスクにおいて人間のパフォーマンスに達するが、言語間変換されたモデルの性能にはまだ大きなギャップがあることを示した。
論文 参考訳(メタデータ) (2020-03-24T19:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。