論文の概要: Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
- arxiv url: http://arxiv.org/abs/2604.09132v1
- Date: Fri, 10 Apr 2026 09:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.793082
- Title: Strips as Tokens: Artist Mesh Generation with Native UV Segmentation
- Title(参考訳): トーケンとしてのストリップ:ネイティブUVセグメンテーションによるアーティストメッシュ生成
- Authors: Rui Xu, Dafei Qin, Kaichun Qiao, Qiujie Dong, Huaijin Pi, Qixuan Zhang, Longwen Zhang, Lan Xu, Jingyi Yu, Wenping Wang, Taku Komura,
- Abstract要約: Strips as Tokens (SATO) は三角形のストリップにインスパイアされたトークン注文戦略を持つ新しいフレームワークである。
本手法は,UV境界を明示的に符号化した面の連結連鎖として配列を構成することにより,組織化されたエッジフローを自然に保存する。
この定式化の鍵となる利点は統一表現であり、同じトークン列を三角形または四辺メッシュに復号することができる。
- 参考スコア(独自算出の注目度): 84.90920018424036
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advancements in autoregressive transformers have demonstrated remarkable potential for generating artist-quality meshes. However, the token ordering strategies employed by existing methods typically fail to meet professional artist standards, where coordinate-based sorting yields inefficiently long sequences, and patch-based heuristics disrupt the continuous edge flow and structural regularity essential for high-quality modeling. To address these limitations, we propose Strips as Tokens (SATO), a novel framework with a token ordering strategy inspired by triangle strips. By constructing the sequence as a connected chain of faces that explicitly encodes UV boundaries, our method naturally preserves the organized edge flow and semantic layout characteristic of artist-created meshes. A key advantage of this formulation is its unified representation, enabling the same token sequence to be decoded into either a triangle or quadrilateral mesh. This flexibility facilitates joint training on both data types: large-scale triangle data provides fundamental structural priors, while high-quality quad data enhances the geometric regularity of the outputs. Extensive experiments demonstrate that SATO consistently outperforms prior methods in terms of geometric quality, structural coherence, and UV segmentation.
- Abstract(参考訳): 近年の自己回帰変換器の進歩は、アーティスト品質のメッシュの生成に顕著な可能性を示している。
しかし、既存の手法が採用するトークン順序付け戦略は、座標に基づくソートが非効率に長いシーケンスを産み出すプロのアーティストの基準を満たすことができず、パッチベースのヒューリスティックは高品質なモデリングに必要な連続的なエッジフローと構造的規則性を阻害する。
これらの制約に対処するために,三角形のストリップに着想を得たトークン順序付け戦略を持つ新しいフレームワークであるStrips as Tokens (SATO)を提案する。
本手法は,UV境界を明示的に符号化した面の連結連鎖としてシーケンスを構成することにより,アーティストが作成したメッシュの組織化されたエッジフローとセマンティックレイアウト特性を自然に保存する。
この定式化の鍵となる利点は統一表現であり、同じトークン列を三角形または四辺メッシュに復号することができる。
この柔軟性は、両方のデータタイプの共同トレーニングを促進する: 大規模三角形データは基本的な構造的事前情報を提供するが、高品質なクアッドデータは出力の幾何学的規則性を高める。
大規模な実験により、SATOは幾何学的品質、構造的コヒーレンス、UVセグメンテーションの点で、従来手法よりも一貫して優れていたことが示されている。
関連論文リスト
- TopoMesh: High-Fidelity Mesh Autoencoding via Topological Unification [44.632513151214084]
TopoMeshは、GTと予測メッシュを、共有デュアルマーチングキューブ(DMC)トポロジフレームワークで統合した、スパースボクセルベースのVAEである。
我々のデコーダは同じDMCフォーマットでメッシュを出力し、予測とターゲットのメッシュが同じトポロジ構造を共有することを保証します。
大規模な実験により、TopoMeshは再建忠実度において既存のVAEを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2026-03-25T13:10:34Z) - LoST: Level of Semantics Tokenization for 3D Shapes [50.847769883816085]
State-of-the-artメソッドは、もともとレンダリングと圧縮のために設計された幾何学的なレベル・オブ・ディテール(LoD)階層に依存している。
本稿では,初期接頭辞が完全かつ可塑性な形状をデコードするように,サリエンスを指示するレベル・オブ・セマンティックス・トークン化(LoST)を提案する。
LoSTはSOTA再構成を実現し、幾何的および意味的再構成のメトリクスにおいて、従来のLoDベースの3次元形状トークン化器を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2026-03-18T17:56:06Z) - Structural Action Transformer for 3D Dexterous Manipulation [80.07649565189035]
クロス・エボディメント・スキル・トランスファーは、ハイDoFロボットハンドの課題である。
既存の手法は、しばしば2次元の観測と時間中心の行動表現に依存し、3次元の空間的関係を捉えるのに苦労する。
本稿では、構造中心の視点を導入することで、このパラダイムに挑戦する新しい3Dデクスタラスな操作ポリシーを提案する。
論文 参考訳(メタデータ) (2026-03-04T11:38:12Z) - FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation [50.71369329585773]
フェースレベルでメッシュを生成する新しいAutoregressive AutoencoderフレームワークであるFACEを紹介する。
当社のワンフェイスワンツーケン戦略は、メッシュの基本構築ブロックである三角形の面を、単一の統一トークンとして扱います。
FACEは、標準ベンチマークで最先端の再構築品質を達成する。
論文 参考訳(メタデータ) (2026-03-02T06:47:15Z) - TreeMeshGPT: Artistic Mesh Generation with Autoregressive Tree Sequencing [47.919057306538626]
TreeMeshGPTは、入力ポイントクラウドに整列した芸術的メッシュを生成するように設計された自動回帰変換器である。
提案手法は,2つのトークンを持つ三角形の面をそれぞれ表現し,圧縮率を約22%とする。
提案手法は,従来手法でよく見られたフリップ正規化を最小化しながら,強い正規配向制約を持つメッシュを生成する。
論文 参考訳(メタデータ) (2025-03-14T17:48:06Z) - MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers [32.169007676811404]
MeshGPTは、アーティストが作ったメッシュに典型的なコンパクトさを反映した、三角形メッシュを生成するための新しいアプローチである。
近年の強力な大規模言語モデルの発展に触発されて,三角メッシュを三角形として自動回帰的に生成するシーケンスベースアプローチを採用した。
論文 参考訳(メタデータ) (2023-11-27T01:20:11Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。