論文の概要: MLUBench: A Benchmark for Lifelong Unlearning Evaluation in MLLMs
- arxiv url: http://arxiv.org/abs/2606.12809v1
- Date: Thu, 11 Jun 2026 02:09:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.535639
- Title: MLUBench: A Benchmark for Lifelong Unlearning Evaluation in MLLMs
- Title(参考訳): MLUBench:MLLMの生涯的アンラーニング評価ベンチマーク
- Authors: He Li, Haoang Chi, Qizhou Wang, Yunxin Mao, Zhiheng Zhang, Jie Tan, Tongliang Liu, Wenjing Yang, Bo Han,
- Abstract要約: マルチモーダル大規模言語モデル(MLLM)は、大規模なマルチモーダルデータに基づいて訓練されており、データの学習がますます重要になる。
実際には、これらの要求は時間とともに順次届き、MLLM Lifelong Unlearningの難しい問題を引き起こします。
MLUBenchは,9つのクラスに127のエンティティを持つ大規模かつ包括的なベンチマークである。
- 参考スコア(独自算出の注目度): 70.42738224240857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal large language models (MLLMs) are trained on massive multimodal data, making data unlearning increasingly important as data owners may request the removal of specific content. In practice, these requests often arrive sequentially over time, giving rise to the challenging problem of MLLM Lifelong Unlearning. However, most existing benchmarks are limited in scale and scope, failing to capture the complexities of MLLM lifelong unlearning. To fill this gap, we introduce the MLUBench, a large-scale and comprehensive benchmark featuring 127 entities across 9 classes under lifelong unlearning requests. We perform extensive experiments using MLUBench and reveal that existing unlearning methods suffer from severe, cumulative degradation. More critically, we further identify the unique challenge of this problem: unlike in unimodal models, MLLM lifelong unlearning is constrained by the need to preserve multimodal alignment. Continually unlearning from one modality could degrade the entire model. To alleviate this challenge, we propose LUMoE, an effective method. Experiments demonstrate that LUMoE significantly mitigates the degradation problem faced by baselines. The source code and the MLUBench dataset are open-sourced in https://github.com/lihe-maxsize/Lifelong_Unlearning_main.
- Abstract(参考訳): MLLM(Multimodal large language model)は、大量のマルチモーダルデータに基づいてトレーニングされるため、データ所有者が特定のコンテンツの削除を要求するため、データの学習がますます重要になる。
実際には、これらの要求は時間とともに順次届き、MLLM Lifelong Unlearningの難しい問題を引き起こします。
しかし、既存のベンチマークのほとんどはスケールとスコープに限られており、MLLMの生涯学習の複雑さを捉えていない。
このギャップを埋めるために、MLUBenchを紹介します。これは、生涯にわたる未学習要求の下で、9つのクラスに127のエンティティを含む、大規模で包括的なベンチマークです。
MLUBenchを用いて広範な実験を行い、既存の未学習手法が重大で累積的な劣化に悩まされていることを明らかにした。
さらに重要なことに、この問題のユニークな課題は、単調モデルとは異なり、MLLMの生涯学習はマルチモーダルアライメントを維持する必要性によって制約される。
1つのモダリティから継続的に学ぶことは、モデル全体を劣化させる可能性がある。
この課題を軽減するために,有効なLUMoEを提案する。
LUMoEは, ベースラインが直面する劣化問題を著しく緩和することを示した。
ソースコードとMLUBenchデータセットはhttps://github.com/lihe-maxsize/Lifelong_Unlearning_mainでオープンソース化されている。
関連論文リスト
- RETLLM: Training and Data-Free MLLMs for Multimodal Information Retrieval [2.2125276321198677]
マルチモーダル情報検索(MMIR)は、テキストや画像、あるいは混合クエリや候補を扱う際の柔軟性に注目されている。
近年のマルチモーダル大言語モデル(MLLM)のブレークスルーにより,MLLMの知識を対照的な微調整フレームワークに組み込むことで,MMIR性能が向上している。
本稿では,MMIRのためのMLLMをトレーニングおよびデータフリーでクエリする新しいフレームワークであるRetLLMを紹介する。
論文 参考訳(メタデータ) (2026-02-25T10:31:32Z) - Improve MLLM Benchmark Efficiency through Interview [41.51050382338298]
大規模データに対する完全なカバレッジのQ&Aテストは、リソース集約的で時間を要する。
より少ない質問を解き放つことで,MLLMのパフォーマンス指標を迅速に取得することを目的としたMLLMインタビュー戦略を提案する。
論文 参考訳(メタデータ) (2025-06-01T07:51:15Z) - PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models [27.338242898495448]
マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて顕著な成功を収めた。
膨大なインターネットソースデータへの依存は、プライバシーとセキュリティの重大な懸念を引き起こす。
マシン・アンラーニング(MU)はこれらの問題に対処するための重要な手法として登場した。
PEBenchはMLLMにおけるMUの徹底的な評価を容易にするために設計された新しいベンチマークである。
論文 参考訳(メタデータ) (2025-03-16T15:26:20Z) - u-LLaVA: Unifying Multi-Modal Tasks via Large Language Model [17.3535277338312]
u-LLaVAは、MLLMの知覚能力を改善するためにピクセル、地域、グローバル機能を統合する革新的な統合マルチタスクフレームワークである。
この研究は、277Kサンプルからなるマスクベースの新しいマルチタスクデータセットに貢献し、MLLMの微粒化知覚能力に挑戦し評価する。
論文 参考訳(メタデータ) (2023-11-09T13:18:27Z) - MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [111.51612340032052]
マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。
本稿では,MLLM 評価ベンチマーク MME について述べる。
知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文 参考訳(メタデータ) (2023-06-23T09:22:36Z) - LLM-Pruner: On the Structural Pruning of Large Language Models [65.02607075556742]
大規模言語モデル(LLM)は、言語理解と生成において顕著な能力を示している。
タスク非依存であり、元のトレーニングデータセットへの依存を最小限に抑えるという2つの制約の範囲内でLLMの圧縮に取り組む。
LLM-Prunerという名前のこの手法は、非臨界結合構造を選択的に除去する構造プルーニングを採用する。
論文 参考訳(メタデータ) (2023-05-19T12:10:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。