論文の概要: VICTOR: Dataset Copyright Auditing in Video Recognition Systems
- arxiv url: http://arxiv.org/abs/2512.14439v1
- Date: Tue, 16 Dec 2025 14:26:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.744989
- Title: VICTOR: Dataset Copyright Auditing in Video Recognition Systems
- Title(参考訳): VICTOR:ビデオ認識システムにおけるデータセット著作権監査
- Authors: Quan Yuan, Zhikun Zhang, Linkang Du, Min Chen, Mingyang Sun, Yunjun Gao, Shibo He, Jiming Chen,
- Abstract要約: 本稿では,ビデオ認識システムにおける最初のデータセット著作権監査手法であるVICTORを提案する。
VICTORは、修正されたサンプルがターゲットモデルの予測行動に与える影響を増幅する。
VICTORはトレーニングビデオや対象モデルに対して,いくつかの摂動機構が存在する場合に頑健であることを示す。
- 参考スコア(独自算出の注目度): 47.270150440169324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video recognition systems are increasingly being deployed in daily life, such as content recommendation and security monitoring. To enhance video recognition development, many institutions have released high-quality public datasets with open-source licenses for training advanced models. At the same time, these datasets are also susceptible to misuse and infringement. Dataset copyright auditing is an effective solution to identify such unauthorized use. However, existing dataset copyright solutions primarily focus on the image domain; the complex nature of video data leaves dataset copyright auditing in the video domain unexplored. Specifically, video data introduces an additional temporal dimension, which poses significant challenges to the effectiveness and stealthiness of existing methods. In this paper, we propose VICTOR, the first dataset copyright auditing approach for video recognition systems. We develop a general and stealthy sample modification strategy that enhances the output discrepancy of the target model. By modifying only a small proportion of samples (e.g., 1%), VICTOR amplifies the impact of published modified samples on the prediction behavior of the target models. Then, the difference in the model's behavior for published modified and unpublished original samples can serve as a key basis for dataset auditing. Extensive experiments on multiple models and datasets highlight the superiority of VICTOR. Finally, we show that VICTOR is robust in the presence of several perturbation mechanisms to the training videos or the target models.
- Abstract(参考訳): ビデオ認識システムは、コンテンツレコメンデーションやセキュリティ監視など、日々の生活に展開されている。
ビデオ認識の開発を強化するため、多くの機関が高度なモデルをトレーニングするためのオープンソースライセンス付き高品質のパブリックデータセットをリリースした。
同時に、これらのデータセットは誤用や侵害の影響を受けやすい。
データセットの著作権監査は、そのような不正使用を特定する効果的なソリューションである。
しかし、既存のデータセット著作権ソリューションは主に画像領域に焦点を当てており、ビデオデータの複雑な性質は、探索されていないビデオ領域におけるデータセット著作権監査を残している。
具体的には、ビデオデータに時間的次元が加わり、既存の手法の有効性とステルスネスに大きな課題が生じる。
本稿では,ビデオ認識システムにおける最初のデータセット著作権監査手法であるVICTORを提案する。
対象モデルの出力差を増大させる汎用的でステルス的なサンプル修正戦略を開発する。
少数のサンプル(例、1%)だけを修正することで、VICTORはターゲットモデルの予測行動に対する修正サンプルの影響を増幅する。
そして、修正および未発表の原サンプルに対するモデルの振る舞いの違いは、データセット監査の鍵となる基礎となる。
複数のモデルとデータセットに関する大規模な実験は、VICTORの優位性を強調している。
最後に、VICTORは、トレーニングビデオやターゲットモデルに対して、いくつかの摂動機構が存在する場合、堅牢であることを示す。
関連論文リスト
- Temporal Unlearnable Examples: Preventing Personal Video Data from Unauthorized Exploitation by Object Tracking [90.81846867441993]
本稿では,ディープトラッカーによる個人ビデオデータの不正利用を防止するための最初の研究について述べる。
時間的非学習可能な例(TUE)を生成するための新しい生成フレームワークを提案する。
提案手法は,VOTモデル,データセット,時間的マッチングタスク間の転送性が強いビデオデータプライバシ保護において,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-07-10T07:11:33Z) - Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation [31.737159092430108]
我々は、異なる生成的アーキテクチャを研究し、バイアスがなく、障害に対して堅牢で、モデル間で共有される差別的特徴を探索し識別する。
本稿では,ウェーブレット分解に基づく新たなデータ拡張戦略を導入し,より関連する法医学的手がかりを活用するために,特定の周波数関連帯域を置き換える。
本手法は最先端検出器よりも精度が向上し, 非常に最近の生成モデルにおいても優れた結果が得られる。
論文 参考訳(メタデータ) (2025-06-20T07:36:59Z) - AnyAnomaly: Zero-Shot Customizable Video Anomaly Detection with LVLM [2.5988879420706095]
ビデオ異常検出(VAD)は、コンピュータビジョンにおけるビデオ分析と監視に不可欠である。
既存のVADモデルは学習された通常のパターンに依存しており、多様な環境に適用することは困難である。
本研究では,C-VAD技術とAnyAnomalyモデルを提案する。
論文 参考訳(メタデータ) (2025-03-06T14:52:34Z) - Tracking the Copyright of Large Vision-Language Models through Parameter Learning Adversarial Images [9.351260848685229]
大規模視覚言語モデル (LVLM) は画像理解と対話能力に優れていた。
広く利用できるようになったことで、不正使用や著作権侵害に対する懸念が高まっている。
本稿では,LVLMの著作権をオリジナルモデルを変更することなく追跡する学習攻撃(PLA)手法を提案する。
論文 参考訳(メタデータ) (2025-02-23T14:49:34Z) - VANE-Bench: Video Anomaly Evaluation Benchmark for Conversational LMMs [64.60035916955837]
VANE-Benchはビデオの異常や矛盾を検出するためのビデオLMMの熟練度を評価するために設計されたベンチマークである。
我々のデータセットは、既存の最先端のテキスト・ビデオ生成モデルを用いて合成された一連のビデオから構成される。
我々は、このベンチマークタスクにおいて、オープンソースとクローズドソースの両方で既存の9つのビデオLMMを評価し、ほとんどのモデルが微妙な異常を効果的に識別するのに困難に直面することを発見した。
論文 参考訳(メタデータ) (2024-06-14T17:59:01Z) - A Dataset and Benchmark for Copyright Infringement Unlearning from Text-to-Image Diffusion Models [52.49582606341111]
著作権法は、クリエイティブ作品を再生、配布、収益化する排他的権利をクリエイターに与えている。
テキスト・ツー・イメージ・ジェネレーションの最近の進歩は、著作権の執行に重大な課題をもたらしている。
CLIP、ChatGPT、拡散モデルを調和させてデータセットをキュレートする新しいパイプラインを導入する。
論文 参考訳(メタデータ) (2024-01-04T11:14:01Z) - AVTENet: A Human-Cognition-Inspired Audio-Visual Transformer-Based Ensemble Network for Video Deepfake Detection [49.81915942821647]
本研究では、ディープフェイクビデオを検出するために、オーディオ・ヴィジュアル・トランスフォーマー・ベースのアンサンブルネットワーク(AVTENet)を導入する。
評価には、最近リリースされたマルチモーダルオーディオビデオFakeAVCelebデータセットを使用する。
AVTENetとその変種およびいくつかの既存手法をFakeAVCelebデータセットの複数のテストセット上で評価する。
論文 参考訳(メタデータ) (2023-10-19T19:01:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。