論文の概要: Training-free Spatially Grounded Geometric Shape Encoding (Technical Report)
- arxiv url: http://arxiv.org/abs/2604.07522v1
- Date: Wed, 08 Apr 2026 18:53:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.519783
- Title: Training-free Spatially Grounded Geometric Shape Encoding (Technical Report)
- Title(参考訳): 無訓練空間接地幾何形状符号化(技術報告)
- Authors: Yuhang He,
- Abstract要約: 本稿では,XShapeEncと呼ばれる2次元空間幾何学形状の学習不要で汎用的な符号化手法を提案する。
XShapeEncは、任意の空間接地された2次元幾何学形状を、5つの好ましい特性を示すコンパクトな表現に符号化する。
我々は、XShapeEncの理論的妥当性、効率、識別可能性、適用性について、広範囲な分析と実験により検証した。
- 参考スコア(独自算出の注目度): 28.258170617490226
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Positional encoding has become the de facto standard for grounding deep neural networks on discrete point-wise positions, and it has achieved remarkable success in tasks where the input can be represented as a one-dimensional sequence. However, extending this concept to 2D spatial geometric shapes demands carefully designed encoding strategies that account not only for shape geometry and pose, but also for compatibility with neural network learning. In this work, we address these challenges by introducing a training-free, general-purpose encoding strategy, dubbed XShapeEnc, that encodes an arbitrary spatially grounded 2D geometric shape into a compact representation exhibiting five favorable properties, including invertibility, adaptivity, and frequency richness. Specifically, a 2D spatially grounded geometric shape is decomposed into its normalized geometry within the unit disk and its pose vector, where the pose is further transformed into a harmonic pose field that also lies within the unit disk. A set of orthogonal Zernike bases is constructed to encode shape geometry and pose either independently or jointly, followed by a frequency-propagation operation to introduce high-frequency content into the encoding. We demonstrate the theoretical validity, efficiency, discriminability, and applicability of XShapeEnc via extensive analysis and experiments across a wide range of shape-aware tasks and our self-curated XShapeCorpus. We envision XShapeEnc as a foundational tool for research that goes beyond one-dimensional sequential data toward frontier 2D spatial intelligence.
- Abstract(参考訳): 位置符号化は、深部ニューラルネットワークを離散的なポイントワイドな位置に置くためのデファクトスタンダードとなり、入力を1次元のシーケンスとして表現できるタスクにおいて顕著な成功を収めた。
しかし、この概念を2次元空間幾何学形状に拡張するには、形状幾何学やポーズだけでなく、ニューラルネットワーク学習との互換性も考慮した符号化戦略を慎重に設計する必要がある。
本研究では、任意の空間的基底を持つ2次元幾何学形状を、可逆性、適応性、周波数富度を含む5つの好ましい特性を示すコンパクトな表現に符号化する、XShapeEncと呼ばれる学習自由で汎用的な符号化戦略を導入することで、これらの課題に対処する。
具体的には、空間的に接地された2次元幾何学形状を、単位円板内の正規化された幾何学とそのポーズベクトルに分解し、さらにそのポーズを単位円盤内にある調和的なポーズ場に変換する。
一組の直交Zernikeベースは形状幾何を符号化し、独立にまたは共同でポーズし、次いで高周波コンテンツを符号化に導入する周波数伝搬演算を行う。
我々は,XShapeEncの理論的妥当性,効率,識別可能性,適用性について,広範囲な形状認識タスクと自己計算型XShapeCorpusを用いて分析および実験を行った。
我々は、XShapeEncを、フロンティア2次元空間知性に向けた1次元連続データを超える研究の基盤となるツールとして想定する。
関連論文リスト
- Make Geometry Matter for Spatial Reasoning [62.61667611352403]
視覚言語モデル(VLM)は、強いイメージと映像理解を実現するが、静的シーンとダイナミックビデオの両方で空間的推論を行う能力は限られている。
近年の進歩は、事前訓練された3次元基礎モデルから幾何学トークンをVLMに注入することで、この制限に対処しようとしている。
我々は、VLMが幾何トークンで積極的に推論するように促すことにより、幾何学的問題を作るためのフレームワークGeoSRを提案する。
論文 参考訳(メタデータ) (2026-03-27T17:45:12Z) - Spherical Geometry Diffusion: Generating High-quality 3D Face Geometry via Sphere-anchored Representations [18.442834011472005]
テキストから3Dの顔生成における根本的な課題は、高品質な幾何学を実現することである。
球面座標に幾何学的信号を固定する新しい顔表現である球面幾何表現を導入する。
次に、この2次元マップ上に構築された条件拡散フレームワークである球拡散幾何学を紹介する。
論文 参考訳(メタデータ) (2026-01-19T20:15:45Z) - Dens3R: A Foundation Model for 3D Geometry Prediction [44.13431776180547]
Dens3Rは幾何学的密度予測のための3次元基礎モデルである。
画像対マッチング機能と本質的不変性モデリングを統合することにより、Dens3Rは複数の幾何学的量を正確に回帰する。
論文 参考訳(メタデータ) (2025-07-22T07:22:30Z) - Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction [14.225228781008209]
本稿では3次元シーン再構成のための新しい幾何学的統合機構を提案する。
提案手法は,特徴学習,特徴融合,ネットワーク監視という3段階の3次元幾何学を取り入れている。
論文 参考訳(メタデータ) (2024-08-28T08:02:47Z) - NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation [52.772319840580074]
3D形状生成は、特定の条件や制約に固執する革新的な3Dコンテンツを作成することを目的としている。
既存の方法は、しばしば3Dの形状を局所化されたコンポーネントの列に分解し、各要素を分離して扱う。
本研究では2次元平面表現を利用した空間認識型3次元形状生成フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T04:09:34Z) - DSG-Net: Learning Disentangled Structure and Geometry for 3D Shape
Generation [98.96086261213578]
DSG-Netは3次元形状の非交叉構造と幾何学的メッシュ表現を学習するディープニューラルネットワークである。
これは、幾何(構造)を不変に保ちながら構造(幾何学)のような不整合制御を持つ新しい形状生成アプリケーションの範囲をサポートする。
本手法は,制御可能な生成アプリケーションだけでなく,高品質な合成形状を生成できる。
論文 参考訳(メタデータ) (2020-08-12T17:06:51Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。