Fugu-MT 論文翻訳(概要): MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models

論文の概要: MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models

arxiv url: http://arxiv.org/abs/2404.04990v1
Date: Sun, 7 Apr 2024 15:23:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-09 16:22:29.676032
Title: MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models
Title（参考訳）: MLaKE: 大規模言語モデルのための多言語知識編集ベンチマーク
Authors: Zihao Wei, Jingcheng Deng, Liang Pang, Hanxing Ding, Huawei Shen, Xueqi Cheng,
Abstract要約: MLaKEは5言語にわたる知識編集手法の適応性のベンチマークである。 MLaKEは、ウィキペディアから言語にまたがるファクトチェーンを集約し、フリーフォームとマルチチョイスの両方で質問を生成する。 MLaKEにおける既存手法の多言語知識編集の一般化能力を評価する。
参考スコア（独自算出の注目度）: 65.10456412127405
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The extensive utilization of large language models (LLMs) underscores the crucial necessity for precise and contemporary knowledge embedded within their intrinsic parameters. Existing research on knowledge editing primarily concentrates on monolingual scenarios, neglecting the complexities presented by multilingual contexts and multi-hop reasoning. To address these challenges, our study introduces MLaKE (Multilingual Language Knowledge Editing), a novel benchmark comprising 4072 multi-hop and 5360 single-hop questions designed to evaluate the adaptability of knowledge editing methods across five languages: English, Chinese, Japanese, French, and German. MLaKE aggregates fact chains from Wikipedia across languages and utilizes LLMs to generate questions in both free-form and multiple-choice. We evaluate the multilingual knowledge editing generalization capabilities of existing methods on MLaKE. Existing knowledge editing methods demonstrate higher success rates in English samples compared to other languages. However, their generalization capabilities are limited in multi-language experiments. Notably, existing knowledge editing methods often show relatively high generalization for languages within the same language family compared to languages from different language families. These results underscore the imperative need for advancements in multilingual knowledge editing and we hope MLaKE can serve as a valuable resource for benchmarking and solution development.
Abstract（参考訳）: 大規模言語モデル(LLM)の広範な活用は、それらの固有のパラメータに埋め込まれた正確かつ現代的な知識にとって重要な必要性を浮き彫りにしている。知識編集に関する既存の研究は、主に単言語シナリオに焦点を合わせ、多言語コンテキストと多言語推論によって提示される複雑さを無視している。 MLaKE(Multilingual Language Knowledge Editing)は,英語,中国語,日本語,フランス語,ドイツ語の5言語にまたがる知識編集手法の適応性を評価するために,4072のマルチホップと5360のシングルホップ質問からなる新しいベンチマークである。 MLaKEはウィキペディアから言語にまたがるファクトチェーンを集約し、LLMを使ってフリーフォームとマルチチョイスの両方で質問を生成する。 MLaKEにおける既存手法の多言語知識編集の一般化能力を評価する。既存の知識編集手法は、他の言語と比較して英語のサンプルの方が高い成功率を示している。しかし、その一般化能力は多言語実験に限られている。特に、既存の知識編集手法は、異なる言語族に属する言語と比較して、同じ言語族に属する言語に対して比較的高い一般化を示すことが多い。これらの結果は,MLaKEがベンチマークやソリューション開発に有用な資源になり得ることを願っている。

論文の概要: MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models

関連論文リスト