論文の概要: VTONGuard: Automatic Detection and Authentication of AI-Generated Virtual Try-On Content
- arxiv url: http://arxiv.org/abs/2601.13951v1
- Date: Tue, 20 Jan 2026 13:26:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.325382
- Title: VTONGuard: Automatic Detection and Authentication of AI-Generated Virtual Try-On Content
- Title(参考訳): VTONGuard:AI生成バーチャルトライオンコンテンツの自動検出と認証
- Authors: Shengyi Wu, Yan Hong, Shengyao Chen, Zheng Wang, Xianbing Sun, Jiahui Zhan, Jun Lan, Jianfu Zhang,
- Abstract要約: 775,000以上の実画像と合成画像を含むベンチマークデータセットであるVTONGuardを提案する。
データセットは、ポーズ、背景、服装スタイルのバリエーションを含む、さまざまな現実世界の状況をカバーする。
本結果は,各手法の強みと弱みを明らかにし,パラダイム間一般化の持続的課題を強調した。
- 参考スコア(独自算出の注目度): 18.869017622630647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid advancement of generative AI, virtual try-on (VTON) systems are becoming increasingly common in e-commerce and digital entertainment. However, the growing realism of AI-generated try-on content raises pressing concerns about authenticity and responsible use. To address this, we present VTONGuard, a large-scale benchmark dataset containing over 775,000 real and synthetic try-on images. The dataset covers diverse real-world conditions, including variations in pose, background, and garment styles, and provides both authentic and manipulated examples. Based on this benchmark, we conduct a systematic evaluation of multiple detection paradigms under unified training and testing protocols. Our results reveal each method's strengths and weaknesses and highlight the persistent challenge of cross-paradigm generalization. To further advance detection, we design a multi-task framework that integrates auxiliary segmentation to enhance boundary-aware feature learning, achieving the best overall performance on VTONGuard. We expect this benchmark to enable fair comparisons, facilitate the development of more robust detection models, and promote the safe and responsible deployment of VTON technologies in practice.
- Abstract(参考訳): 生成AIの急速な進歩に伴い、仮想トライオン(VTON)システムは、電子商取引やデジタルエンターテイメントにおいてますます一般的になりつつある。
しかし、AIが生み出す試作品の現実主義の高まりは、信頼性と責任ある使用に対する懸念を高めている。
これを解決するために,775,000以上の実画像と合成画像を含む大規模ベンチマークデータセットであるVTONGuardを提案する。
データセットは、ポーズ、背景、衣服スタイルのバリエーションを含むさまざまな現実世界の条件をカバーし、本物と操作された例の両方を提供する。
このベンチマークに基づいて、統一的なトレーニングおよびテストプロトコルの下で、複数の検出パラダイムを体系的に評価する。
その結果,各手法の長所と短所が明らかとなり,パラダイム間一般化の持続的課題が浮き彫りになった。
さらに,VTONGuardの総合性能を向上し,境界認識機能学習を強化するために,補助セグメンテーションを統合したマルチタスク・フレームワークを設計する。
我々は、このベンチマークが公正な比較を可能にし、より堅牢な検出モデルの開発を促進し、実際にVTON技術の安全かつ責任ある展開を促進することを期待する。
関連論文リスト
- SSVP: Synergistic Semantic-Visual Prompting for Industrial Zero-Shot Anomaly Detection [55.54007781679915]
本稿では,多種多様な視覚的エンコーディングを効率よく融合させ,モデルの微粒化知覚を高めるSynergistic Semantic-Visual Prompting (SSVP)を提案する。
SSVPは、MVTec-AD上で93.0%のImage-AUROCと92.2%のPixel-AUROCで最先端のパフォーマンスを達成し、既存のゼロショットアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2026-01-14T04:42:19Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Deep Learning Models for Robust Facial Liveness Detection [56.08694048252482]
本研究では,現代のアンチスプーフィング手法の欠陥に対処する新しい深層学習モデルを用いて,ロバストな解を提案する。
テクスチャ解析と実際の人間の特性に関連する反射特性を革新的に統合することにより、我々のモデルは、顕著な精度でレプリカと真の存在を区別する。
論文 参考訳(メタデータ) (2025-08-12T17:19:20Z) - Toward Safe, Trustworthy and Realistic Augmented Reality User Experience [0.0]
我々の研究は、特に重要な情報を妨害したり、ユーザーの知覚を微妙に操作するタスク・デトリメンタルARコンテンツのリスクに対処する。
視覚言語モデル (VLM) とマルチモーダル推論モジュール (マルチモーダル推論モジュール) を用いて, それらの攻撃を検出する2つのシステム, ViDDAR と VIM-Sense を開発した。
論文 参考訳(メタデータ) (2025-07-31T03:42:52Z) - AI-GenBench: A New Ongoing Benchmark for AI-Generated Image Detection [9.540547388707987]
Ai-GenBenchは、現実のシナリオにおけるAI生成イメージの堅牢な検出の必要性に対処するために設計された、新しいベンチマークである。
Ai-GenBenchは、明確な評価ルールと制御された拡張戦略を確立することにより、検出方法とスケーラブルなソリューションの有意義な比較を可能にする。
論文 参考訳(メタデータ) (2025-04-29T15:41:13Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - XAI-based Feature Ensemble for Enhanced Anomaly Detection in Autonomous Driving Systems [1.3022753212679383]
本稿では,複数の Explainable AI (XAI) メソッドを統合する新しい機能アンサンブルフレームワークを提案する。
このフレームワークは、6つの多様なAIモデルにまたがって、これらのXAIメソッドによって識別されるトップ機能を融合することによって、異常の検出に不可欠な堅牢で包括的な機能のセットを生成する。
我々の技術は、AIモデルの精度、堅牢性、透明性の向上を示し、より安全で信頼性の高い自動運転システムに貢献します。
論文 参考訳(メタデータ) (2024-10-20T14:34:48Z) - Causality-Aware Transformer Networks for Robotic Navigation [13.719643934968367]
Visual Navigationの現在の研究は、改善の機会を明らかにしている。
RNNとTransformerの直接的な採用はしばしば、Embodied AIと従来のシーケンシャルなデータモデリングの具体的な違いを見落としている。
因果理解モジュールを特徴とするナビゲーション用因果認識変換器(CAT)ネットワークを提案する。
論文 参考訳(メタデータ) (2024-09-04T12:53:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。