論文の概要: SPRITETOMESH: Automatic Mesh Generation for 2D Skeletal Animation Using Learned Segmentation and Contour-Aware Vertex Placement
- arxiv url: http://arxiv.org/abs/2602.21153v1
- Date: Tue, 24 Feb 2026 17:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.872517
- Title: SPRITETOMESH: Automatic Mesh Generation for 2D Skeletal Animation Using Learned Segmentation and Contour-Aware Vertex Placement
- Title(参考訳): SPRITETOMESH:学習セグメンテーションと輪郭対応頂点配置を用いた2次元骨格アニメーションの自動メッシュ生成
- Authors: Bastien Gimbert,
- Abstract要約: SPRITETOMESHは、2Dゲームスプライト画像を三角形メッシュに変換するための完全な自動パイプラインである。
172ゲームから10,000以上のスプライトマスクペアでトレーニングされたセグメンテーションネットワークは、IoUの0.87を達成している。
パイプラインはスプライトを3秒未満で処理し、手動で作成する速度は300x-1200倍である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present SPRITETOMESH, a fully automatic pipeline for converting 2D game sprite images into triangle meshes compatible with skeletal animation frameworks such as Spine2D. Creating animation-ready meshes is traditionally a tedious manual process requiring artists to carefully place vertices along visual boundaries, a task that typically takes 15-60 minutes per sprite. Our method addresses this through a hybrid learned-algorithmic approach. A segmentation network (EfficientNet-B0 encoder with U-Net decoder) trained on over 100,000 sprite-mask pairs from 172 games achieves an IoU of 0.87, providing accurate binary masks from arbitrary input images. From these masks, we extract exterior contour vertices using Douglas-Peucker simplification with adaptive arc subdivision, and interior vertices along visual boundaries detected via bilateral-filtered multi-channel Canny edge detection with contour-following placement. Delaunay triangulation with mask-based centroid filtering produces the final mesh. Through controlled experiments, we demonstrate that direct vertex position prediction via neural network heatmap regression is fundamentally not viable for this task: the heatmap decoder consistently fails to converge (loss plateau at 0.061) while the segmentation decoder trains normally under identical conditions. We attribute this to the inherently artistic nature of vertex placement - the same sprite can be meshed validly in many different ways. This negative result validates our hybrid design: learned segmentation where ground truth is unambiguous, algorithmic placement where domain heuristics are appropriate. The complete pipeline processes a sprite in under 3 seconds, representing a speedup of 300x-1200x over manual creation. We release our trained model to the game development community.
- Abstract(参考訳): SPRITETOMESHは2Dゲームスプライト画像をSpine2Dのような骨格アニメーションフレームワークと互換性のある三角形メッシュに変換する完全自動パイプラインである。
アニメーション対応のメッシュを作るのは、伝統的に面倒な手作業で、アーティストは縁を視覚的境界に沿って慎重に配置する必要がある。
本手法は,ハイブリッド学習アルゴリズムを用いてこの問題に対処する。
172ゲームから10万以上のスプライトマスクペアをトレーニングしたセグメンテーションネットワーク(EfficientNet-B0 encoder with U-Net decoder)は0.87のIoUを達成し、任意の入力画像から正確なバイナリマスクを提供する。
これらのマスクから,適応弧分割によるダグラス・ペッカーの簡易化による外輪郭縁の抽出と,輪郭追従配置による両側フィルタ多チャンネルカニーエッジ検出による視覚境界に沿った内輪郭の抽出を行った。
マスクベースのセントロイドフィルタリングによるデラウネー三角測量は最終メッシュを生成する。
制御された実験により,ニューラルネットのヒートマップ回帰による直接頂点位置予測は基本的には不可能であることが示され,熱マップデコーダは連続的に収束せず(0.061の台地を欠く)、セグメンテーションデコーダは通常同じ条件で訓練される。
私たちはこれを、本質的に芸術的な頂点配置の性質に帰着する。同じスプライトは、様々な方法で有効にメッシュ化することができる。
この否定的な結果は我々のハイブリッド設計を検証している: 基礎的真理が曖昧である学習セグメンテーション、ドメインヒューリスティックが適切であるアルゴリズム的な配置。
完全なパイプラインはスプライトを3秒未満で処理し、手作業による300x-1200倍のスピードアップを表現している。
トレーニングされたモデルをゲーム開発コミュニティにリリースします。
関連論文リスト
- Class-agnostic 3D Segmentation by Granularity-Consistent Automatic 2D Mask Tracking [10.223105883919278]
本稿では,フレーム間の時間的対応を維持する2次元マスク追跡手法を提案する。
本手法は, 整合性および高精度な3次元セグメンテーションを効果的に生成する。
論文 参考訳(メタデータ) (2025-11-02T03:52:42Z) - OV-MAP : Open-Vocabulary Zero-Shot 3D Instance Segmentation Map for Robots [18.200635521222267]
OV-MAPは、オブジェクト認識機能を高めるために、オープンな特徴を3Dマップに統合することで、移動ロボットのためのオープンワールド3Dマッピングの新しいアプローチである。
我々は2次元マスクを3次元空間に投影するクラス非依存セグメンテーションモデルと、点雲から生の深度と合成の深度をマージして作成した補足深度画像を組み合わせた。
このアプローチは、3Dマスク投票機構とともに、3D教師付きセグメンテーションモデルに頼ることなく、正確なゼロショット3Dインスタンスセグメンテーションを可能にする。
論文 参考訳(メタデータ) (2025-06-13T08:49:23Z) - MeshPad: Interactive Sketch-Conditioned Artist-Reminiscent Mesh Generation and Editing [64.84885028248395]
MeshPadは、スケッチ入力から3Dメッシュを生成するジェネレーティブなアプローチである。
我々は、メッシュの領域の"削除"に編集を分解し、新しいメッシュ幾何学の"追加"に続き、一貫した編集を可能にすることに重点を置いている。
提案手法は,メッシュ三角形の追加と削除のために,大規模なTransformerモデルを利用した三角形列に基づくメッシュ表現に基づいている。
論文 参考訳(メタデータ) (2025-03-03T11:27:44Z) - Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Pixel-Aligned Non-parametric Hand Mesh Reconstruction [16.62199923065314]
非パラメトリックメッシュ再構成は、最近3Dの手と身体の応用において顕著な進歩を見せている。
本稿では,このマッピングをシンプルでコンパクトなアーキテクチャで構築し,活用することを目的とする。
3つのフェーズからなるハンドメッシュリカバリタスクのためのエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2022-10-17T15:53:18Z) - Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud
Pre-training [56.81809311892475]
Masked Autoencoders (MAE) は、言語と2次元画像変換器の自己教師付き事前学習において大きな可能性を示している。
我々は3次元点雲の階層的自己教師型学習のための強力なマルチスケールMAE事前学習フレームワークであるPoint-M2AEを提案する。
論文 参考訳(メタデータ) (2022-05-28T11:22:53Z) - Subdivision-Based Mesh Convolution Networks [38.09613983540932]
畳み込みニューラルネットワーク(CNN)は、2Dコンピュータビジョンにおいて大きなブレークスルーをもたらした。
本稿では,ループ分割シーケンス接続を伴う3次元トライアングルメッシュのための新しいCNNフレームワークSubdivNetを提案する。
メッシュ分類,セグメンテーション,対応,実世界からの検索実験により,SubdivNetの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-06-04T06:50:34Z) - ParaNet: Deep Regular Representation for 3D Point Clouds [62.81379889095186]
ParaNetは、3Dポイントクラウドを表現するための新しいエンドツーエンドのディープラーニングフレームワークである。
不規則な3D点雲を通常の2Dカラー画像に変換する。
多視点投影とボキセル化に基づく従来の正規表現法とは異なり、提案した表現は微分可能で可逆である。
論文 参考訳(メタデータ) (2020-12-05T13:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。