論文の概要: Is My Vision-Language Data in Your AI? Membership Inference Test (MINT) Demo 2
- arxiv url: http://arxiv.org/abs/2606.14748v1
- Date: Fri, 05 Jun 2026 06:15:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-21 20:00:42.772009
- Title: Is My Vision-Language Data in Your AI? Membership Inference Test (MINT) Demo 2
- Title(参考訳): 私のビジョンランゲージデータはAIにあるか?メンバシップ推論テスト(MINT)デモ2
- Authors: Daniel DeAlcala, Gonzalo Mancera, Julian Fierrez, Aythami Morales, Ruben Tolosana, Ruben Vera-Rodriguez,
- Abstract要約: 機械学習トレーニングプロセスの透明性向上を目的としたフレームワークとして,メンバシップ推論テスト(MINT)デモ2を紹介する。
MINTは、機械学習モデルのトレーニングで特定のデータが使用されたかどうかを実験的に判定する技術である。
このデモは、AI透明性を促進し、新興AI規制の遵守を促進するための実践的なツールを提供することを目的としている。
- 参考スコア(独自算出の注目度): 15.90369373219501
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present the Membership Inference Test (MINT) Demo 2, a framework designed to improve transparency in machine learning training processes. MINT is a technique for experimentally determining whether specific data were used during machine learning model training. We establish the theoretical framework and propose multiple architectures for MINT depending on the amount of information known about the models that are being audited. Experimental results using a popular face recognition model, 4 state-of-the-art LLMs, and multiple, diverse, and large-scale public image and text databases achieve promising accuracy levels in the detection of training data of up to 90%. Building on these results, we introduce a comprehensive web platform1 that expands these capabilities to image and text modalities. The platform integrates a diverse technological stack, including MINT, aMINT, and gMINT, allowing users to audit a wide range of models. This demonstrator aims to promote AI transparency and provides a practical tool to foster compliance with emerging AI regulations.
- Abstract(参考訳): 機械学習トレーニングプロセスの透明性向上を目的としたフレームワークとして,メンバシップ推論テスト(MINT)デモ2を紹介する。
MINTは、機械学習モデルのトレーニングで特定のデータが使用されたかどうかを実験的に判定する技術である。
我々は,監査対象のモデルに関する情報量に応じて,理論的な枠組みを確立し,MINTのための複数のアーキテクチャを提案する。
一般的な顔認識モデル,4つの最先端LCM,および多種多種多様な大規模公開画像およびテキストデータベースを用いて,最大90%のトレーニングデータ検出において有望な精度を実現する実験結果を得た。
これらの結果に基づいて、画像とテキストのモダリティにこれらの機能を拡張した包括的Webプラットフォーム1を導入する。
このプラットフォームは、MINT、aMINT、gMINTを含む多様な技術スタックを統合し、ユーザーが広範囲のモデルを監査できるようにする。
このデモは、AI透明性を促進し、新興AI規制の遵守を促進するための実践的なツールを提供することを目的としている。
関連論文リスト
- Active Membership Inference Test (aMINT): Enhancing Model Auditability with Multi-Task Learning [18.552238031865286]
アクティブメンバーシップ推論テスト(英: Active Membership Inference Test、aMINT)は、機械学習モデルのトレーニング中に与えられたデータが使用されているかどうかを検出する方法である。
本稿では,2つのモデルを同時に学習するマルチタスク学習プロセスを提案する。
我々は、MobileNetのような軽量アーキテクチャから、Vision Transformerのようなより複雑なアーキテクチャまで、幅広いニューラルネットワークを用いて結果を提示する。
論文 参考訳(メタデータ) (2025-09-09T16:00:03Z) - MINT-Demo: Membership Inference Test Demonstrator [13.795574322456797]
MINTは、機械学習モデルのトレーニング中に特定のデータが使用されているかどうかを実験的に判定する技術である。
一般的な顔認識モデルと2200万以上の画像を含む5つの公開データベースを用いて実験を行った。
論文 参考訳(メタデータ) (2025-03-11T11:45:05Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs [61.143381152739046]
視覚中心のアプローチで設計したマルチモーダルLLM(MLLM)のファミリーであるCambrian-1を紹介する。
本研究は,様々な視覚表現を評価するためのインタフェースとして,LLMとビジュアルインストラクションチューニングを用いた。
モデルウェイト、コード、サポートツール、データセット、詳細なインストラクションチューニングと評価のレシピを提供しています。
論文 参考訳(メタデータ) (2024-06-24T17:59:42Z) - Is My Data in Your AI? Membership Inference Test (MINT) applied to Face Biometrics [18.552238031865286]
この記事では、AI/MLモデルのトレーニング中に与えられたデータが使用されているかどうかを経験的に評価することを目的とした新しいアプローチである、メンバシップ推論テスト(MINT)を紹介します。
本稿では,学習過程に使用されるデータに監査モデルが露出した場合に現れるアクティベーションパターンを学習するための2つのMINTアーキテクチャを提案する。
実験は6つの公開データベースを使って行われ、合計で2200万以上の顔画像で構成されている。
論文 参考訳(メタデータ) (2024-02-14T15:09:01Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset,
Framework, and Benchmark [81.42376626294812]
本稿では,Language-Assisted Multi-Modalインストラクションチューニングデータセット,フレームワーク,ベンチマークを提案する。
我々の目標は、MLLMのトレーニングと評価のための成長するエコシステムとしてLAMMを確立することです。
本稿では,2次元および3次元視覚のための広範囲な視覚タスクをカバーする包括的データセットとベンチマークを提案する。
論文 参考訳(メタデータ) (2023-06-11T14:01:17Z) - Motivating Learners in Multi-Orchestrator Mobile Edge Learning: A
Stackelberg Game Approach [54.28419430315478]
Mobile Edge Learningは、異種エッジデバイス上で機械学習モデルの分散トレーニングを可能にする。
MELでは、十分なトレーニングデータやコンピューティングリソースを入手することなく、トレーニング性能が低下する。
そこで我々は2ラウンドのStackelbergゲームとしてオーケストレータとラーナーの相互作用を定式化するインセンティブ機構を提案する。
論文 参考訳(メタデータ) (2021-09-25T17:27:48Z) - DiVA: Diverse Visual Feature Aggregation for Deep Metric Learning [83.48587570246231]
視覚的類似性は多くのコンピュータビジョンアプリケーションにおいて重要な役割を果たす。
ディープ・メトリック・ラーニング(DML)は、そのような類似性を学ぶための強力なフレームワークである。
我々は,概念的に異なるデータ関係を対象とする複数の補完学習タスクを提案し,研究する。
我々は、訓練信号を集約する単一モデルを学び、その結果、強力な一般化と最先端のパフォーマンスが得られる。
論文 参考訳(メタデータ) (2020-04-28T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。