論文の概要: PatternGSL: A Structured Specification Language for Template-Free and Simulation-Ready 3D Garments
- arxiv url: http://arxiv.org/abs/2606.24564v1
- Date: Tue, 23 Jun 2026 13:32:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.969134
- Title: PatternGSL: A Structured Specification Language for Template-Free and Simulation-Ready 3D Garments
- Title(参考訳): PatternGSL: テンプレートフリーでシミュレーション可能な3Dガーメントのための構造化仕様言語
- Authors: Zhenyang Li, Lutao Jiang, Yizhou Zhao, Ying-Cong Chen, Xin Wang, Weikai Chen, Yifan Peng,
- Abstract要約: 本稿ではテンプレートフリーで学習可能な仕様言語であるPatternGSLについて述べる。
本稿では,単一画像から直接PatternGSL仕様を予測し,それらを衣服に復号する視覚言語フレームワークを提案する。
- 参考スコア(独自算出の注目度): 52.50602518973252
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reconstructing realistic, physically plausible garments from a single image remains a fundamental challenge. Template-free methods capture surface geometry but lack explicit sewing structure for simulation; while programmatic systems are simulation-ready but constrained by predefined templates. This reveals a fundamental representation gap between geometric reconstruction and structured garment construction. We present PatternGSL, a structured garment representation in the form of a template-free and learnable specification language that encodes complete sewing patterns, including panel boundaries, parameterized seams, and explicit stitch topology, in a compact and standardized form. PatternGSL preserves the physical rigor of pattern-based models while removing template dependence, elevating sewing structure as a first-class target for generative modeling. We further propose a vision-language framework that predicts PatternGSL specifications directly from a single image and decodes them into garments using lightweight deterministic validity handling, without optimization-based refinement or manual cleanup. In addition, we introduce PatternGSLData, the first large-scale image-to-GSL paired dataset comprising 300K samples with complete sewing pattern annotations, enabling supervised VLM training for structured garment reconstruction. Experiments demonstrate improved pattern accuracy over prior baselines, explicit sewing-structure recovery, reliable cloth simulation, and pattern-level editing through the same deterministic decoding pipeline. Code and data-processing scripts will be released at https://github.com/PatternGSL/PatternGSL.
- Abstract(参考訳): 1枚の画像からリアルで、物理的にもっともらしい衣服を再構築することは、依然として根本的な課題だ。
テンプレートなしの手法は表面形状をキャプチャするが、シミュレーションのための明示的な縫製構造は欠如している。
このことは、幾何学的再構成と構造化された衣服構成の基本的な表現ギャップを明らかにしている。
本稿では,パネル境界,パラメータ化シーム,明示的な縫合トポロジを含む完全な縫製パターンを,コンパクトで標準化された形式でエンコードするテンプレートフリーで学習可能な仕様言語として,構造化された衣服表現であるPatternGSLを提案する。
PatternGSLは、テンプレート依存を除去しつつ、パターンベースのモデルの物理的厳密さを保ち、縫製構造を生成モデリングの第一級ターゲットとして高めている。
さらに、1つの画像から直接PatternGSL仕様を予測し、それらを軽量な決定論的妥当性処理を用いて、最適化ベースの改善や手作業によるクリーンアップなしに、衣服に復号するビジョン言語フレームワークを提案する。
さらに,300Kサンプルと完全な縫製パターンアノテーションを用いた大規模画像とGSLのペアデータセットであるPatternGSLDataを導入し,構造化衣料品復元のための教師付きVLMトレーニングを可能にした。
実験では、以前のベースラインよりも優れたパターン精度、明示的な縫製構造回復、信頼性のある布のシミュレーション、同じ決定論的デコードパイプラインによるパターンレベルの編集が示されている。
コードとデータ処理のスクリプトはhttps://github.com/PatternGSL/PatternGSLでリリースされる。
関連論文リスト
- GarmageNet: A Multimodal Generative Framework for Sewing Pattern Design and Generic Garment Modeling [35.49678134341859]
GarmageNetは、2Dミシンパターンの作成を自動化する生成フレームワークである。
ガーマージ(Garmage)は、各パネルを構造的幾何学的イメージとしてエンコードする、新しい衣服表現である。
GarmageSetは14,801のプロフェッショナルデザインの衣服からなる大規模なデータセットである。
論文 参考訳(メタデータ) (2025-04-02T08:37:32Z) - ChatGarment: Garment Estimation, Generation and Editing via Large Language Models [79.46056192947924]
ChatGarmentは、大規模な視覚言語モデル(VLM)を活用して、3D衣服の見積もり、生成、編集を自動化する新しいアプローチである。
ウィジェット内の画像やスケッチから縫製パターンを推定し、テキスト記述から生成し、ユーザー指示に基づいて衣服を編集することができる。
論文 参考訳(メタデータ) (2024-12-23T18:59:28Z) - PatternPaint: Practical Layout Pattern Generation Using Diffusion-Based Inpainting [4.9540362281086265]
PatternPaintは、限定的なデザインルール準拠のトレーニングサンプルで法的パターンを生成することができる拡散ベースのフレームワークである。
我々のモデルは、複雑な2次元金属配線設計規則設定において法的なパターンを生成できる唯一のモデルである。
その結果、新しい技術ノードの開発において、レイアウトパターン生成のための実運用対応のアプローチを実証した。
論文 参考訳(メタデータ) (2024-09-02T16:02:26Z) - ChatPattern: Layout Pattern Customization via Natural Language [18.611898021267923]
ChatPatternはフレキシブルパターンカスタマイズのための新しいLarge-Language-Modelフレームワークである。
LLMエージェントは、自然言語の要求を解釈し、特定の要求を満たす設計ツールを操作することができる。
ジェネレータは条件付きレイアウト生成、パターン修正、メモリフレンドリーなパターン拡張を最適化する。
論文 参考訳(メタデータ) (2024-03-15T09:15:22Z) - CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model [55.321010757641524]
CLIP4STRは,CLIPのイメージエンコーダとテキストエンコーダ上に構築された,シンプルで効果的なSTRメソッドである。
モデルサイズ、事前トレーニングデータ、トレーニングデータの観点からCLIP4STRをスケールし、13のSTRベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-05-23T12:51:20Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。