論文の概要: Knowledge Beyond Language: Bridging the Gap in Multilingual Machine Unlearning Evaluation
- arxiv url: http://arxiv.org/abs/2605.14404v1
- Date: Thu, 14 May 2026 05:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.64489
- Title: Knowledge Beyond Language: Bridging the Gap in Multilingual Machine Unlearning Evaluation
- Title(参考訳): 言語以外の知識:マルチリンガルマシンの未学習評価におけるギャップを埋める
- Authors: Kyomin Hwang, Hyeonjin Kim, Sangyeon Cho, Nojun Kwak,
- Abstract要約: 多言語コーパスでは、MMU(Multilingual Machine Unlearning)は複数の言語にまたがる情報を削除することを目的としている。
以前のMMU評価では、そのような言語横断的な情報の分布を捉えられなかった。
本稿では,知識分離可能性スコア(KSS)と知識永続化スコア(KPS)の2つの指標を提案する。
- 参考スコア(独自算出の注目度): 30.69647061828668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While LLMs are increasingly used in commercial services, they pose privacy risks such as leakage of sensitive personally identifiable information (PII). For LLMs trained on multilingual corpora, Multilingual Machine Unlearning (MMU) aims to remove information across multiple languages. However, prior MMU evaluations fail to capture such cross-linguistic distribution of information, being largely limited to direct extensions of per-language evaluation protocols. To this end, we propose two metrics to evaluate the information spread across languages: the Knowledge Separability Score (KSS) and the Knowledge Persistence Score (KPS). KSS measures the overall unlearning quality across multiple languages, while KPS more specifically aims to assess consistent removal of information among different language pairs. We evaluated various unlearning methods in the multilingual setting with these metrics and conducted comprehensive analyses. Through our investigation, we provide insights into unique phenomena exclusive to MMU and offer a new perspective on MMU evaluation.
- Abstract(参考訳): LLMは商業サービスでの利用が増えているが、機密性のある個人識別情報(PII)の漏洩などのプライバシーリスクが生じる。
多言語コーパスでトレーニングされたLLMに対して、MMU(Multilingual Machine Unlearning)は、複数の言語にまたがる情報を削除することを目的としている。
しかし、事前のMMU評価は、言語ごとの評価プロトコルの直接拡張に大きく制限されているため、そのような言語横断的な情報の分布を捉えられなかった。
そこで本稿では,KSS(Knowledge Separability Score)とKPS(Knowledge Persistence Score)の2つの指標を提案する。
KSSは、複数の言語にまたがる全体的な非学習品質を測定し、KPSは、より具体的には、異なる言語ペア間の情報の一貫した削除を評価することを目的としている。
これらの指標を用いて、多言語設定における様々な未学習手法を評価し、総合的な分析を行った。
本研究を通じて,本研究は,MMUに限った現象の洞察を提供し,MMU評価の新たな視点を提供する。
関連論文リスト
- LiveCLKTBench: Towards Reliable Evaluation of Cross-Lingual Knowledge Transfer in Multilingual LLMs [67.09110757873142]
言語間知識伝達の分離と計測を目的とした自動生成パイプラインであるLiveCLKTBenchを提案する。
我々のパイプラインは、実世界のドメインから自己完結した、時間に敏感な知識エンティティを識別する。
これらの有効なエンティティのドキュメントは、複数の言語に翻訳される事実的な質問を生成するために使用される。
論文 参考訳(メタデータ) (2025-11-03T17:06:49Z) - Tracing Multilingual Knowledge Acquisition Dynamics in Domain Adaptation: A Case Study of English-Japanese Biomedical Adaptation [25.87847731982824]
多言語ドメイン適応(ML-DA)は、言語間の新しいドメイン知識を大規模言語モデル(LLM)に学習するために広く用いられている。
本研究では,ML-DA における LLM の学習力学について検討する。
AdaXEvalは、トレーニングに使用される同じバイリンガルドメインコーパスから複数選択QAデータセットを構築する適応評価手法である。
論文 参考訳(メタデータ) (2025-10-14T03:34:17Z) - Multilingual Self-Taught Faithfulness Evaluators [11.200203292660758]
合成多言語要約データからのみ学習するフレームワークである。
我々のフレームワークは、最先端の英語評価器や機械翻訳に基づくアプローチなど、既存のベースラインよりも改善されている。
論文 参考訳(メタデータ) (2025-07-28T12:01:59Z) - Multilingual Large Language Models: A Systematic Survey [38.972546467173565]
本稿では,多言語大言語モデル(MLLM)の最新研究を包括的に調査する。
まず,MLLMのアーキテクチャと事前学習の目的について論じ,多言語機能に寄与する重要なコンポーネントや方法論を強調した。
本稿では,MLLMの言語間知識,推論,人的価値との整合性,安全性,解釈可能性,専門的応用に関する詳細な分類とロードマップを示す。
論文 参考訳(メタデータ) (2024-11-17T13:21:26Z) - How Do Multilingual Language Models Remember Facts? [50.13632788453612]
これまでに同定された英語のリコール機構が多言語文脈に適用可能であることを示す。
我々は、リコール中の言語の役割をローカライズし、エンリッチメントが言語に依存しないことを発見した。
デコーダのみのLLMでは、FVは2つの異なる段階でこれらの2つの情報を構成する。
論文 参考訳(メタデータ) (2024-10-18T11:39:34Z) - Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - Cross-lingual Lifelong Learning [53.06904052325966]
本稿では,言語間連続学習(CCL)の評価パラダイムを提案する。
マルチリンガルなシーケンシャルな学習を特に難しいものにするための洞察を提供する。
この分析の意味は、異なる言語間連続学習のデシダータを測り、バランスをとる方法のレシピを含む。
論文 参考訳(メタデータ) (2022-05-23T09:25:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。