Fugu-MT 論文翻訳(概要): Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval

論文の概要: Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval

arxiv url: http://arxiv.org/abs/2503.09011v1
Date: Wed, 12 Mar 2025 02:59:41 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-13 21:17:52.591702
Title: Word2winners at SemEval-2025 Task 7: Multilingual and Crosslingual Fact-Checked Claim Retrieval
Title（参考訳）: SemEval-2025 Task 7におけるWord2winners: Multilingual and Crosslingual Fact-Checked Claim Retrieval
Authors: Amirmohammad Azadi, Sina Zamani, Mohammadmostafa Rostamkhani, Sauleh Eetemadi,
Abstract要約: 本稿では,SemEval 2025 Task 7:以前のFact-Checked Claim Retrievalについて述べる。このタスクは、広範囲な多言語MultiClaimデータセットから与えられた入力クレームに関する関連する事実チェックを取得する必要がある。最適なモデルでは,クロスリンガルデータでは85%,モノリンガルデータでは92%の精度が得られた。
参考スコア（独自算出の注目度）: 0.7874708385247352
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper describes our system for SemEval 2025 Task 7: Previously Fact-Checked Claim Retrieval. The task requires retrieving relevant fact-checks for a given input claim from the extensive, multilingual MultiClaim dataset, which comprises social media posts and fact-checks in several languages. To address this challenge, we first evaluated zero-shot performance using state-of-the-art English and multilingual retrieval models and then fine-tuned the most promising systems, leveraging machine translation to enhance crosslingual retrieval. Our best model achieved an accuracy of 85% on crosslingual data and 92% on monolingual data.
Abstract（参考訳）: 本稿では,SemEval 2025 Task 7:以前のFact-Checked Claim Retrievalについて述べる。このタスクでは、ソーシャルメディア投稿と複数の言語でのファクトチェックを含む多言語MultiClaimデータセットから、入力クレームに関する関連するファクトチェックを取得する必要がある。この課題に対処するために、我々はまず最先端の英語および多言語検索モデルを用いてゼロショット性能を評価し、次に機械翻訳を活用して言語横断検索を強化することで最も有望なシステムを微調整した。最良のモデルでは,クロスリンガルデータでは85%,モノリンガルデータでは92%の精度が得られた。

関連論文リスト

TIFIN India at SemEval-2025: Harnessing Translation to Overcome Multilingual IR Challenges in Fact-Checked Claim Retrieval [0.10417205448468168]
我々は、モノリンガルとクロスリンガルの設定において、以前に事実確認されたクレームを取得するという課題に対処する。提案手法は,細調整埋め込みモデルとLLMリランカを用いた信頼性の高いベースライン検索システムである。
論文参考訳（メタデータ） (2025-04-23T11:34:35Z)
Entity-aware Cross-lingual Claim Detection for Automated Fact-checking [7.242609314791262]
Ex-Claimは,任意の言語で記述されたクレームの処理をうまく一般化する,エンティティ対応の言語間クレーム検出モデルである。提案手法は,27言語にまたがるベースラインを著しく上回り,限られた学習データであっても,最も高い知識伝達率を達成する。
論文参考訳（メタデータ） (2025-03-19T14:00:55Z)
AILS-NTUA at SemEval-2025 Task 8: Language-to-Code prompting and Error Fixing for Tabular Question Answering [5.130890556960832]
本稿では,SemEval-2025 Task 8: Question Question Answering over Tabular Dataについて述べる。このタスクは、DataBenchデータセットに基づいて評価され、構造化データに対する自然言語の質問に答えるLarge Language Modelsの機能を評価する。自然言語クエリを実行可能なコードに変換するために,LLMを効果的に活用するシステムを提案する。
論文参考訳（メタデータ） (2025-03-01T10:24:42Z)
Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [71.12193680015622]
プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文参考訳（メタデータ） (2025-02-18T09:11:44Z)
Synergistic Approach for Simultaneous Optimization of Monolingual, Cross-lingual, and Multilingual Information Retrieval [5.446052898856584]
本稿では,モノリンガル,クロスリンガル,マルチリンガル設定におけるゼロショット検索性能を改善するためのハイブリッドバッチ学習手法を提案する。このアプローチは、データセットサイズに基づいてサンプリングされたモノリンガルとクロスリンガルの問合せ対のバッチを混合したマルチリンガル言語モデルを微調整する。
論文参考訳（メタデータ） (2024-08-20T04:30:26Z)
Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning [98.60739735409243]
英語のような高リソース言語で訓練された言語モデルの言語間移動は、多くのNLPタスクのために広く研究されている。並列および大規模多言語会話データセットである言語間アライメント事前学習のためのXSGDを導入する。協調的な言語間表現を容易にするために,アライメントプロンプトを学習するための効率的なプロンプトチューニング手法を開発した。
論文参考訳（メタデータ） (2023-04-03T18:46:01Z)
Modeling Sequential Sentence Relation to Improve Cross-lingual Dense Retrieval [87.11836738011007]
マスク付き文モデル(MSM)と呼ばれる多言語多言語言語モデルを提案する。 MSMは、文表現を生成する文エンコーダと、文書から文ベクトルのシーケンスに適用される文書エンコーダとから構成される。モデルをトレーニングするために,サンプル負の階層的コントラスト損失によって文ベクトルをマスクし,予測するマスク付き文予測タスクを提案する。
論文参考訳（メタデータ） (2023-02-03T09:54:27Z)
CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文参考訳（メタデータ） (2022-09-05T17:36:14Z)
Matching Tweets With Applicable Fact-Checks Across Languages [27.762055254009017]
ソーシャルメディア投稿(ツイート)のクレームに対する既存のファクトチェックを自動的に見つけることに重点を置いています。モノリンガル(英語のみ)、マルチリンガル(スペイン語、ポルトガル語)、クロスリンガル(ヒンディー語-英語)の設定において、分類と検索の両方の実験を行う。 4つの言語対における「マッチ」分類(平均精度93%)の有望な結果を示す。
論文参考訳（メタデータ） (2022-02-14T23:33:02Z)
TransWiC at SemEval-2021 Task 2: Transformer-based Multilingual and Cross-lingual Word-in-Context Disambiguation [0.8883733362171032]
我々のアプローチは事前訓練されたトランスフォーマーモデルに基づいており、言語固有の処理やリソースは一切使用しない。本モデルでは,英語サブタスクの精度が0.90であり,その精度は0.93である。我々のアプローチは、他のモノリンガル言語とクロスランガル言語の組み合わせで満足できる結果も達成します。
論文参考訳（メタデータ） (2021-04-09T23:06:05Z)
CoSDA-ML: Multi-Lingual Code-Switching Data Augmentation for Zero-Shot Cross-Lingual NLP [68.2650714613869]
我々は,mBERTを微調整するための多言語コードスイッチングデータを生成するためのデータ拡張フレームワークを提案する。既存の研究と比較すると,本手法は訓練にバイリンガル文を頼らず,複数の対象言語に対して1つの学習プロセスしか必要としない。
論文参考訳（メタデータ） (2020-06-11T13:15:59Z)
Learning to Scale Multilingual Representations for Vision-Language Tasks [51.27839182889422]
SMALRの有効性は、これまでビジョン言語タスクでサポートされた2倍以上の10の多言語で実証されている。単語の埋め込み手法と比較して,訓練パラメータの1/5以下で,複数言語による画像文検索と先行作業の3～4%の性能評価を行った。
論文参考訳（メタデータ） (2020-04-09T01:03:44Z)
XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization [128.37244072182506]
言語間TRansfer Evaluation of Multilinguals XTREMEは、40言語および9タスクにわたる多言語表現の言語間一般化能力を評価するためのベンチマークである。我々は、英語でテストされたモデルは、多くのタスクにおいて人間のパフォーマンスに達するが、言語間変換されたモデルの性能にはまだ大きなギャップがあることを示した。
論文参考訳（メタデータ） (2020-03-24T19:09:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。