Fugu-MT 論文翻訳(概要): Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

論文の概要: Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

arxiv url: http://arxiv.org/abs/2604.19748v2
Date: Wed, 22 Apr 2026 07:56:57 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-23 15:36:10.53573
Title: Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items
Title（参考訳）: Tstars-Tryon 1.0: さまざまなファッションアイテムのロバストでリアルなバーチャルトライオン
Authors: Mengting Chen, Zhengrui Chen, Yongchao Du, Zuan Gao, Taihang Hu, Jinsong Lan, Chao Lin, Yefeng Shen, Xingjian Wang, Zhao Wang, Zhengtao Wu, Xiaoli Xu, Zhengze Xu, Hao Yan, Mingzhou Zhang, Jun Zheng, Qinye Zhou, Xiaoyong Zhu, Bo Zheng,
Abstract要約: Tstars-Tryon 1.0は商用規模の仮想試用システムで、堅牢で、現実的で、汎用的で、非常に効率的である。きめ細かな細部を持ち、着物のテクスチャ、材料特性、構造特性を忠実に保存する。このモデルはTaobao Appの産業規模で展開され、何千万ものリクエストを数百万のユーザに提供する。
参考スコア（独自算出の注目度）: 26.122295817842325
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent advances in image generation and editing have opened new opportunities for virtual try-on. However, existing methods still struggle to meet complex real-world demands. We present Tstars-Tryon 1.0, a commercial-scale virtual try-on system that is robust, realistic, versatile, and highly efficient. First, our system maintains a high success rate across challenging cases like extreme poses, severe illumination variations, motion blur, and other in-the-wild conditions. Second, it delivers highly photorealistic results with fine-grained details, faithfully preserving garment texture, material properties, and structural characteristics, while largely avoiding common AI-generated artifacts. Third, beyond apparel try-on, our model supports flexible multi-image composition (up to 6 reference images) across 8 fashion categories, with coordinated control over person identity and background. Fourth, to overcome the latency bottlenecks of commercial deployment, our system is heavily optimized for inference speed, delivering near real-time generation for a seamless user experience. These capabilities are enabled by an integrated system design spanning end-to-end model architecture, a scalable data engine, robust infrastructure, and a multi-stage training paradigm. Extensive evaluation and large-scale product deployment demonstrate that Tstars-Tryon1.0 achieves leading overall performance. To support future research, we also release a comprehensive benchmark. The model has been deployed at an industrial scale on the Taobao App, serving millions of users with tens of millions of requests.
Abstract（参考訳）: 画像生成と編集の最近の進歩により、仮想試行の新たな機会が開けている。しかし、既存の手法は依然として複雑な現実世界の要求を満たすのに苦労している。商業規模の仮想試行システムであるTstars-Tryon 1.0について述べる。ひとつは、極端なポーズ、激しい照明のバリエーション、動きのぼやけなどの難題にまたがる高い成功率を維持することです。第二に、非常にフォトリアリスティックな結果に細部まで細部を刻み込み、テクスチャ、材料特性、構造特性を忠実に保ちながら、一般的なAI生成アーティファクトをほとんど避けている。第3に、アパレル試行以上に、私たちのモデルは8つのファッションカテゴリにまたがる柔軟なマルチイメージ合成(最大6つの参照画像)をサポートし、個人のアイデンティティと背景を協調的に制御する。第4に、商用デプロイメントのレイテンシボトルネックを克服するため、当社のシステムは推論速度に非常に最適化されており、シームレスなユーザエクスペリエンスを実現するために、ほぼリアルタイムな生成を実現しています。これらの機能は、エンドツーエンドのモデルアーキテクチャ、スケーラブルなデータエンジン、堅牢なインフラストラクチャ、マルチステージトレーニングパラダイムにまたがる統合システム設計によって実現されます。大規模な評価と大規模な製品展開は、Tstars-Tryon1.0が全体的なパフォーマンスをリードすることを示している。今後の研究を支援するため、包括的なベンチマークもリリースしています。このモデルはTaobao Appの産業規模で展開され、何千万ものリクエストを数百万のユーザに提供する。

関連論文リスト

ViSA: 3D-Aware Video Shading for Real-Time Upper-Body Avatar Creation [62.86900540547787]
現在の3Dアバター生成法は、ぼやけたテクスチャや固い不自然な動きといったアーティファクトに悩まされることが多い。両パラダイムの強みを組み合わせた新しいアプローチを提案する。ビデオモデルの生成能力と3次元再構成の幾何学的安定性を結合することにより,高忠実度デジタルアバターを製作する。
論文参考訳（メタデータ） (2025-12-08T17:10:29Z)
DreamVVT: Mastering Realistic Video Virtual Try-On in the Wild via a Stage-Wise Diffusion Transformer Framework [26.661935208583756]
VVT(Virtual try-on)技術は、eコマース広告やエンターテイメントに将来性があるとして、学術的な関心を集めている。本研究では,現実のシナリオにおける適応性を高めるために,多種多様な人間中心データを活用することが可能なDreamVVTを提案する。第1段階では、入力ビデオから代表フレームをサンプリングし、視覚言語モデル(VLM)と統合された多フレーム試行モデルを用いて、高忠実で意味論的に整合した試行画像を合成する。第2段階では、微粒な動きと外観記述とともに骨格図が作成される。
論文参考訳（メタデータ） (2025-08-04T18:27:55Z)
Mogao: An Omni Foundation Model for Interleaved Multi-Modal Generation [54.588082888166504]
我々は、因果アプローチを通じてインターリーブされたマルチモーダル生成を可能にする統一的なフレームワークであるMogaoを提案する。 Mogooは、Deep-fusion設計、デュアルビジョンエンコーダ、インターリーブされた回転位置埋め込み、マルチモーダル分類器フリーガイダンスなど、アーキテクチャ設計における重要な技術的改善のセットを統合している。実験により,モガオはマルチモーダル理解とテキスト・ツー・イメージ生成において最先端の性能を発揮するとともに,高品質でコヒーレントなインターリーブ・アウトプットの創出にも優れていることが示された。
論文参考訳（メタデータ） (2025-05-08T17:58:57Z)
FRAME: Floor-aligned Representation for Avatar Motion from Egocentric Video [52.33896173943054]
ヘッドマウントのボディフェイスステレオカメラを備えたエゴセントリックなモーションキャプチャーは、VRやARアプリケーションには不可欠だ。既存の方法は、合成事前学習と、現実の環境で滑らかで正確な予測を生成するのに苦労している。本稿では、デバイスポーズとカメラフィードを組み合わせて、最先端のボディポーズ予測を行う、シンプルで効果的なアーキテクチャFRAMEを提案する。
論文参考訳（メタデータ） (2025-03-29T14:26:06Z)
ITVTON: Virtual Try-On Diffusion Transformer Based on Integrated Image and Text [1.7071356210178177]
ITVTONは、Diffusion Transformer (DiT) を単一のジェネレータとして活用し、画像の忠実性を向上させる効率的なフレームワークである。 ITVTONは、幅寸法に沿って衣服や人物の画像を効果的にキャプチャし、両方のテキスト記述を組み込む。 IGPairによる10,257枚の画像対の実験により、実世界のシナリオにおけるITVTONの堅牢性が確認された。
論文参考訳（メタデータ） (2025-01-28T07:24:15Z)
TryOffAnyone: Tiled Cloth Generation from a Dressed Person [1.4732811715354452]
高忠実なタイル付き衣料品画像は、パーソナライズされたレコメンデーション、服装構成、バーチャルトライオンシステムに不可欠である。本研究では, 微調整型安定拡散モデルを用いた新しい手法を提案する。本手法は,服飾用マスクを統合し,対象の衣服を効果的に分離・処理する,一段ネットワーク設計の合理化を特徴とする。
論文参考訳（メタデータ） (2024-12-11T17:41:53Z)
Coral Model Generation from Single Images for Virtual Reality Applications [22.18438294137604]
本稿では,1つの画像から高精度な3次元サンゴモデルを生成するディープラーニングフレームワークを提案する。このプロジェクトには、AI生成モデルをインタラクティブな"アートワーク"に変換するための説明可能なAI(XAI)が組み込まれている。
論文参考訳（メタデータ） (2024-09-04T01:54:20Z)
AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario [50.62711489896909]
AnyFitは、高解像度のベンチマークと実世界のデータのベースラインを、大きなギャップで上回っている。 AnyFitの高忠実度バーチャル試作品における印象的なパフォーマンスは、あらゆるイメージから見ても、ファッションコミュニティにおける将来の研究の新たな道を切り開くものです。
論文参考訳（メタデータ） (2024-05-28T13:33:08Z)
Advancing Plain Vision Transformer Towards Remote Sensing Foundation Model [97.9548609175831]
約1億のパラメータを持つプレーンビジョントランスフォーマーを利用して、リモートセンシングタスク用にカスタマイズされた大規模なビジョンモデルを提案する。具体的には、RS画像における大きな画像サイズと様々な向きのオブジェクトを扱うために、回転する様々なウィンドウアテンションを提案する。検出タスクの実験は、DOTA-V1.0データセット上で81.16%のmAPを達成したすべての最先端モデルよりも、我々のモデルの方が優れていることを示す。
論文参考訳（メタデータ） (2022-08-08T09:08:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。