論文の概要: ICU-Bench:Benchmarking Continual Unlearning in Multimodal Large Language Models
- arxiv url: http://arxiv.org/abs/2605.05938v1
- Date: Thu, 07 May 2026 09:46:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.67247
- Title: ICU-Bench:Benchmarking Continual Unlearning in Multimodal Large Language Models
- Title(参考訳): ICU-Bench:マルチモーダル大規模言語モデルにおける連続的アンラーニングのベンチマーク
- Authors: Yuhang Wang, Wenjie Mei, Junkai Zhang, Guangyu He, Zhenxing Niu, Haichang Gao,
- Abstract要約: ICU-Benchは,プライバシクリティカルな文書データに基づく連続的マルチモーダルアンラーニングベンチマークである。
ICU-Benchには、医療報告と労働契約という2つの文書ドメインから1000のプライバシーに敏感なプロフィールがあり、9,500の画像、16,000の質問応答ペア、100の忘れタスクがある。
新しい連続的アンラーニングメトリクスを導入し、有効性を忘れること、歴史的に忘れることの保存、有効性、安定性を総合的に分析する。
- 参考スコア(独自算出の注目度): 23.490977443704068
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Although Multimodal Large Language Models (MLLMs) have achieved remarkable progress across many domains, their training on large-scale multimodal datasets raises serious privacy concerns, making effective machine unlearning increasingly necessary. However, existing benchmarks mainly focus on static or short-sequence settings, offering limited support for evaluating continual privacy deletion requests in realistic deployments. To bridge this gap, we introduce ICU-Bench, a continual multimodal unlearning benchmark built on privacy-critical document data. ICU-Bench contains 1,000 privacy-sensitive profiles from two document domains, medical reports and labor contracts, with 9,500 images, 16,000 question-answer pairs, and 100 forget tasks. Additionally, new continual unlearning metrics are introduced, facilitating a comprehensive analysis of forgetting effectiveness, historical forgetting preservation, retained utility, and stability throughout the continual unlearning process. Through extensive experiments with representative unlearning methods on ICU-Bench, we show that existing methods generally struggle in continual settings and exhibit clear limitations in balancing forgetting quality, utility preservation, and scalability over long task sequences. These findings highlight the need for multimodal unlearning methods explicitly designed for continual privacy deletion.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)は多くの領域で顕著な進歩を遂げているが、大規模なマルチモーダルデータセットでのトレーニングは深刻なプライバシー上の懸念を提起し、効果的な機械学習の必要性がますます高まっている。
しかし、既存のベンチマークは主に静的または短いシーケンス設定に重点を置いており、現実的なデプロイメントにおける継続的なプライバシ削除要求を評価するための限定的なサポートを提供している。
このギャップを埋めるために、プライバシクリティカルな文書データに基づく連続的なマルチモーダルなアンラーニングベンチマークであるICU-Benchを紹介します。
ICU-Benchには、医療報告と労働契約という2つの文書ドメインから1000のプライバシーに敏感なプロフィールがあり、9,500の画像、16,000の質問応答ペア、100の忘れタスクがある。
さらに、新しい連続的アンラーニングメトリクスを導入し、連続的アンラーニングプロセスを通じて、有効性を忘れること、歴史的に忘れることの保存、持続的アンラーニングプロセスにおける有用性、安定性の包括的な分析を容易にする。
ICU-Benchにおける代表的なアンラーニング手法による広範な実験を通じて,既存の手法は連続的な設定に苦しむのが一般的であることを示す。
これらの知見は、連続的なプライバシ削除のために明示的に設計されたマルチモーダルなアンラーニング手法の必要性を浮き彫りにした。
関連論文リスト
- Continual Learning for VLMs: A Survey and Taxonomy Beyond Forgetting [70.83781268763215]
視覚言語モデル(VLM)は、大規模事前学習を活用することで、多様なマルチモーダルタスクにおいて優れたパフォーマンスを実現している。
VLMは、クロスモーダル機能ドリフト、共有アーキテクチャによるパラメータ干渉、ゼロショット機能侵食など、ユニークな課題に直面している。
本調査は、生涯の視覚言語システムを開発する研究者にとって、包括的かつ診断的な基準となることを目的としている。
論文 参考訳(メタデータ) (2025-08-06T09:03:10Z) - Continual Multimodal Contrastive Learning [99.53621521696051]
MCL(Multimodal Contrastive Learning)は、異なるモダリティを整列し、関節空間におけるマルチモーダル表現を生成する。
マルチモーダルデータは単一のプロセスで収集されることはめったになく、スクラッチからのトレーニングは計算コストがかかる。
本稿では, 安定性と塑性の2つの原理によりCMCLを定式化する。
理論的には、二辺から部分空間への勾配の更新を計画する、新しい最適化に基づく手法を導出する。
論文 参考訳(メタデータ) (2025-03-19T07:57:08Z) - PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models [27.338242898495448]
マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて顕著な成功を収めた。
膨大なインターネットソースデータへの依存は、プライバシーとセキュリティの重大な懸念を引き起こす。
マシン・アンラーニング(MU)はこれらの問題に対処するための重要な手法として登場した。
PEBenchはMLLMにおけるMUの徹底的な評価を容易にするために設計された新しいベンチマークである。
論文 参考訳(メタデータ) (2025-03-16T15:26:20Z) - Multi-SpaCE: Multi-Objective Subsequence-based Sparse Counterfactual Explanations for Multivariate Time Series Classification [3.8305310459921587]
マルチSpaCEは、時系列データの近接性、疎性、可視性、整合性をバランスさせる。
常に完全な妥当性を達成し、既存の方法と比較して優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-12-14T09:21:44Z) - Beyond Unimodal Learning: The Importance of Integrating Multiple Modalities for Lifelong Learning [23.035725779568587]
ディープニューラルネットワーク(DNN)におけるマルチモーダル性の役割と相互作用について検討する。
以上の結果から,複数のビューと相補的な情報を複数のモーダルから活用することで,より正確かつ堅牢な表現を学習できることが示唆された。
本稿では,各モーダルにおけるデータ点間の関係構造的類似性を利用して,異なるモーダルからの情報の統合と整合化を行う手法を提案する。
論文 参考訳(メタデータ) (2024-05-04T22:02:58Z) - MultiZoo & MultiBench: A Standardized Toolkit for Multimodal Deep
Learning [110.54752872873472]
MultiZooは、20コアのマルチモーダルアルゴリズムの標準化実装からなる公開ツールキットである。
MultiBenchは15のデータセット、10のモダリティ、20の予測タスク、6の研究領域にまたがるベンチマークである。
論文 参考訳(メタデータ) (2023-06-28T17:59:10Z) - MultiBench: Multiscale Benchmarks for Multimodal Representation Learning [87.23266008930045]
MultiBenchは15のデータセット、10のモダリティ、20の予測タスク、6の研究領域にまたがる、体系的で統一されたベンチマークである。
データローディング、実験的なセットアップ、モデル評価を簡素化し、標準化する、エンドツーエンドの自動機械学習パイプラインを提供する。
大規模なマルチモーダルデータセットに対するロバストネスや、現実的な不完全性に対するロバストネスなど、将来の研究に対する影響の高い課題が紹介されている。
論文 参考訳(メタデータ) (2021-07-15T17:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。