論文の概要: VTBench: Comprehensive Benchmark Suite Towards Real-World Virtual Try-on Models
- arxiv url: http://arxiv.org/abs/2505.19571v1
- Date: Mon, 26 May 2025 06:37:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.218649
- Title: VTBench: Comprehensive Benchmark Suite Towards Real-World Virtual Try-on Models
- Title(参考訳): VTBench: 現実世界の仮想トライオンモデルに向けた総合ベンチマークスイート
- Authors: Hu Xiaobin, Liang Yujie, Luo Donghao, Peng Xu, Zhang Jiangning, Zhu Junwei, Wang Chengjie, Fu Yanwei,
- Abstract要約: VTBenchは、仮想画像試行を階層的、非絡み合いの次元に分解する階層型ベンチマークスイートである。
このベンチマークは仮想試行生成のための5つの重要な次元を含んでいる。
VTBenchは、すべてのテストセット、評価プロトコル、生成された結果、人間のアノテーションを含むオープンソースになる。
- 参考スコア(独自算出の注目度): 3.7098434045639874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While virtual try-on has achieved significant progress, evaluating these models towards real-world scenarios remains a challenge. A comprehensive benchmark is essential for three key reasons:(1) Current metrics inadequately reflect human perception, particularly in unpaired try-on settings;(2)Most existing test sets are limited to indoor scenarios, lacking complexity for real-world evaluation; and (3) An ideal system should guide future advancements in virtual try-on generation. To address these needs, we introduce VTBench, a hierarchical benchmark suite that systematically decomposes virtual image try-on into hierarchical, disentangled dimensions, each equipped with tailored test sets and evaluation criteria. VTBench exhibits three key advantages:1) Multi-Dimensional Evaluation Framework: The benchmark encompasses five critical dimensions for virtual try-on generation (e.g., overall image quality, texture preservation, complex background consistency, cross-category size adaptability, and hand-occlusion handling). Granular evaluation metrics of corresponding test sets pinpoint model capabilities and limitations across diverse, challenging scenarios.2) Human Alignment: Human preference annotations are provided for each test set, ensuring the benchmark's alignment with perceptual quality across all evaluation dimensions. (3) Valuable Insights: Beyond standard indoor settings, we analyze model performance variations across dimensions and investigate the disparity between indoor and real-world try-on scenarios. To foster the field of virtual try-on towards challenging real-world scenario, VTBench will be open-sourced, including all test sets, evaluation protocols, generated results, and human annotations.
- Abstract(参考訳): 仮想試行は大きな進歩を遂げているが、これらのモデルを現実のシナリオに向けて評価することは依然として課題である。
総合的なベンチマークは、3つの主要な理由において不可欠である:(1)現在のメトリクスは人間の知覚を不適切に反映しておらず、特に不適切な試行環境では、(2)既存のテストセットは屋内のシナリオに限られており、実際の評価の複雑さが欠如している。
これらのニーズに対処するために,仮想画像試行を階層的に分解する階層型ベンチマークスイートであるVTBenchを紹介する。
VTBenchには3つの大きな利点がある: 1) マルチ次元評価フレームワーク: このベンチマークは仮想的な試行錯誤生成のための5つの重要な次元(画像品質、テクスチャ保存、複雑な背景の一貫性、カテゴリ間サイズ適応性、ハンドオクルージョンハンドリング)を含んでいる。
2) ヒューマンアライメント(Human Alignment): 人間の嗜好アノテーションは各テストセットに対して提供され、ベンチマークがすべての評価範囲にわたって知覚品質と整合することを保証する。
3) 有意義な洞察: 標準的な屋内環境を超えて, モデルの性能変化を次元によって分析し, 屋内と現実の試行シナリオの相違について検討する。
VTBenchは、現実世界のシナリオに挑戦するためのバーチャルトライオンの分野を促進するために、すべてのテストセット、評価プロトコル、生成された結果、人間のアノテーションを含むオープンソース化される。
関連論文リスト
- PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation [1.470703050699957]
本稿では,各手法を各種データセット上で評価する,標準化されたテスト環境を提案する。
本稿では,事前および将来のモデルを体系的に再評価するための統合フレームワークであるPoseBench3Dを提案する。
論文 参考訳(メタデータ) (2025-05-16T05:49:23Z) - CrossVTON: Mimicking the Logic Reasoning on Cross-category Virtual Try-on guided by Tri-zone Priors [63.95051258676488]
CrossVTONは、クロスカテゴリ仮想試行のための堅牢なフィッティングイメージを生成するためのフレームワークである。
クロスカテゴリ試行に必要な複雑な推論を構造化フレームワークに切り離す。
定性評価と定量的評価の両方において、既存のベースラインを超え、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-20T09:05:35Z) - WorldSimBench: Towards Video Generation Models as World Simulators [79.69709361730865]
我々は、予測モデルの機能を階層に分類し、WorldSimBenchと呼ばれる2つの評価フレームワークを提案することにより、World Simulatorの評価の第一歩を踏み出す。
WorldSimBenchにはExplicit Perceptual EvaluationとImplicit Manipulative Evaluationが含まれている。
我々の総合的な評価は、ビデオ生成モデルのさらなる革新を促進する重要な洞察を与え、World Simulatorsをエンボディされた人工知能への重要な進歩と位置づけている。
論文 参考訳(メタデータ) (2024-10-23T17:56:11Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - VBench: Comprehensive Benchmark Suite for Video Generative Models [100.43756570261384]
VBenchは、"ビデオ生成品質"を特定の、階層的、そして非絡み合ったディメンションに分解するベンチマークスイートである。
我々は、人間の知覚とベンチマークの整合性を検証するために、人間の嗜好アノテーションのデータセットを提供する。
VBenchは、すべてのプロンプト、評価方法、生成されたビデオ、人間の好みのアノテーションを含むオープンソースとして公開します。
論文 参考訳(メタデータ) (2023-11-29T18:39:01Z) - UMSE: Unified Multi-scenario Summarization Evaluation [52.60867881867428]
要約品質評価は、テキスト要約における非自明なタスクである。
統一多シナリオ要約評価モデル(UMSE)を提案する。
UMSEは3つの評価シナリオで使用できる能力に係わる最初の統合要約評価フレームワークである。
論文 参考訳(メタデータ) (2023-05-26T12:54:44Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Sim2Real Object-Centric Keypoint Detection and Description [40.58367357980036]
キーポイントの検出と記述はコンピュータビジョンにおいて中心的な役割を果たす。
対象中心の定式化を提案し、各関心点が属する対象をさらに特定する必要がある。
我々はシミュレーションで訓練されたモデルを現実のアプリケーションに一般化できるsim2realコントラスト学習機構を開発した。
論文 参考訳(メタデータ) (2022-02-01T15:00:20Z) - SVIRO: Synthetic Vehicle Interior Rear Seat Occupancy Dataset and
Benchmark [11.101588888002045]
SVIROは10台の異なる車両の旅客室におけるシーンの合成データセットである。
限られたバリエーションに基づいて学習した際の一般化能力と信頼性について、機械学習に基づくアプローチを解析する。
論文 参考訳(メタデータ) (2020-01-10T14:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。