論文の概要: MultiMind at SemEval-2025 Task 7: Crosslingual Fact-Checked Claim Retrieval via Multi-Source Alignment
- arxiv url: http://arxiv.org/abs/2512.20950v1
- Date: Wed, 24 Dec 2025 05:14:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.684281
- Title: MultiMind at SemEval-2025 Task 7: Crosslingual Fact-Checked Claim Retrieval via Multi-Source Alignment
- Title(参考訳): SemEval-2025 Task 7 における MultiMind: マルチソースアライメントによるクロスリンガル Fact-Checked Claim Retrieval
- Authors: Mohammad Mahdi Abootorabi, Alireza Ghahramani Kure, Mohammadali Mohammadkhani, Sina Elahimanesh, Mohammad Ali Ali Panah,
- Abstract要約: 本稿では,SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrievalについて述べる。
本稿では,TriAlignerについて紹介する。TriAlignerは,2つのエンコーダアーキテクチャを対照的な学習で活用し,異なるモダリティにまたがるネイティブとイングリッシュの両方の翻訳を取り入れた新しいアプローチである。
本手法は,複数の言語にまたがるアライメントの相対的重要性を学習することにより,複数の言語にまたがるクレームを効果的に検索する。
- 参考スコア(独自算出の注目度): 2.470492053534817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents our system for SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval. In an era where misinformation spreads rapidly, effective fact-checking is increasingly critical. We introduce TriAligner, a novel approach that leverages a dual-encoder architecture with contrastive learning and incorporates both native and English translations across different modalities. Our method effectively retrieves claims across multiple languages by learning the relative importance of different sources in alignment. To enhance robustness, we employ efficient data preprocessing and augmentation using large language models while incorporating hard negative sampling to improve representation learning. We evaluate our approach on monolingual and crosslingual benchmarks, demonstrating significant improvements in retrieval accuracy and fact-checking performance over baselines.
- Abstract(参考訳): 本稿では,SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrievalについて述べる。
誤報が急速に広まる時代には、効果的な事実確認がますます重要になっている。
本稿では,TriAlignerについて紹介する。TriAlignerは,2つのエンコーダアーキテクチャを対照的な学習で活用し,異なるモダリティにまたがるネイティブとイングリッシュの両方の翻訳を取り入れた新しいアプローチである。
本手法は,複数の言語にまたがるアライメントの相対的重要性を学習することにより,複数の言語にまたがるクレームを効果的に検索する。
頑健性を高めるため,我々は大規模言語モデルを用いた効率的なデータ前処理と拡張を行い,表現学習を改善するためにハードネガティブサンプリングを取り入れた。
モノリンガルおよびクロスリンガルのベンチマークに対するアプローチを評価し,ベースライン上での検索精度とファクトチェック性能の大幅な向上を実証した。
関連論文リスト
- Boosting Data Utilization for Multilingual Dense Retrieval [47.16651389111977]
高品質な高負のサンプルと効果的なミニバッチデータを得ることにより,多言語高密度検索におけるデータ利用率を向上させる手法を提案する。
16言語を用いた多言語検索ベンチマークであるMIRACLの実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2025-09-11T13:42:50Z) - Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval [0.7874708385247352]
本稿では,SemEval 2025 Task 7:以前のFact-Checked Claim Retrievalについて述べる。
このタスクは、広範囲な多言語MultiClaimデータセットから与えられた入力クレームに関する関連する事実チェックを取得する必要がある。
最適なモデルでは,クロスリンガルデータでは85%,モノリンガルデータでは92%の精度が得られた。
論文 参考訳(メタデータ) (2025-03-12T02:59:41Z) - CrossIn: An Efficient Instruction Tuning Approach for Cross-Lingual Knowledge Alignment [38.35458193262633]
英語中心のモデルは、通常他の言語では準最適である。
そこで本研究では,言語間命令チューニングデータの混合合成を利用したCrossInという新しい手法を提案する。
論文 参考訳(メタデータ) (2024-04-18T06:20:50Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Language Agnostic Multilingual Information Retrieval with Contrastive
Learning [59.26316111760971]
本稿では,多言語情報検索システムの学習方法を提案する。
並列コーパスと非並列コーパスを利用して、事前訓練された多言語言語モデルを改善する。
我々のモデルは少数のパラレル文でもうまく機能する。
論文 参考訳(メタデータ) (2022-10-12T23:53:50Z) - CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual
Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。
クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。
提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文 参考訳(メタデータ) (2022-09-05T17:36:14Z) - Are Multilingual Models Effective in Code-Switching? [57.78477547424949]
多言語モデルの有効性を検討し,複合言語設定の能力と適応性について検討する。
この結果から,事前学習した多言語モデルでは,コードスイッチングにおける高品質な表現が必ずしも保証されないことが示唆された。
論文 参考訳(メタデータ) (2021-03-24T16:20:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。