論文の概要: Beyond Spatial Compression: Interface-Centric Generative States for Open-World 3D Structure
- arxiv url: http://arxiv.org/abs/2605.10438v1
- Date: Mon, 11 May 2026 12:09:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.794455
- Title: Beyond Spatial Compression: Interface-Centric Generative States for Open-World 3D Structure
- Title(参考訳): 空間圧縮を超えて:オープンワールド3次元構造のためのインタフェース中心生成状態
- Authors: Xiang Chen, Alexander Binder,
- Abstract要約: 現在の3Dトークンは、表現を空間圧縮として扱うが、コンポーネントの所有権とアタッチメントの妥当性は暗黙的に残す。
我々は、トークン化がパッシブ圧縮コードではなく操作状態を構成する、インターフェイス中心の生成状態という別の視点を定式化する。
我々は、この定式化を、C2LT-3D(Component-Conditioned Canonical Local Tokens)でインスタンス化し、表現を標準局所幾何学、パーティション条件付きコンテキスト、およびリレーショナルシーム変数に分解する。
- 参考スコア(独自算出の注目度): 55.17771962316751
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current 3D tokenizers largely treat representation as spatial compression: compact codes reconstruct surface geometry, but leave component ownership and attachment validity implicit. In open-world assets with intersecting components, noisy topology, and weak canonical structure, this creates a representation mismatch: local shape, component identity, and assembly relations become entangled in a latent stream and are not natively addressable during decoding. We formulate an alternative view, interface-centric generative states, in which tokenization constructs an operational state rather than a passive compressed code. The state exposes local geometry, component ownership, and attachment validity as variables that can be queried, constrained, and repaired during decoding. We instantiate this formulation with Component-Conditioned Canonical Local Tokens (C2LT-3D), factorizing representation into canonical local geometry, partition-conditioned context, and relational seam variables. Each factor targets a distinct failure mode of compression-centric tokens: pose leakage, cross-component interference, or invalid local attachment. This exposed state supports attachment validation, latent structural repair, targeted intervention, and constrained serialization without a separate post-hoc structure recovery module. Trained on single-object CAD models and evaluated zero-shot on open-world multi-component assets, C2LT-3D improves structural robustness and shows that its latent variables remain actionable under adversarial attachment settings. These results suggest that open-world 3D generative representations should be evaluated not only by reconstruction fidelity, but by whether their discrete states remain operational for assembly-level structural reasoning.
- Abstract(参考訳): コンパクトコードは表面形状を再構成するが、コンポーネントの所有権とアタッチメントの妥当性は暗黙的に残す。
交差するコンポーネント、ノイズトポロジー、弱い正準構造を持つオープンワールドアセットにおいて、これは表現ミスマッチを生成する。
我々は、トークン化がパッシブ圧縮コードではなく操作状態を構成する、インターフェイス中心の生成状態という別の視点を定式化する。
状態は、ローカルなジオメトリ、コンポーネントのオーナシップ、アタッチメントの妥当性を、デコード時にクエリ、制約、修正できる変数として公開する。
我々は、この定式化を、C2LT-3D(Component-Conditioned Canonical Local Tokens)でインスタンス化し、表現を標準局所幾何学、パーティション条件付きコンテキスト、およびリレーショナルシーム変数に分解する。
各因子は、圧縮中心トークンの個別の障害モード、すなわち、リークのポーズ、クロスコンポーネント干渉、または無効なローカルアタッチメントをターゲットにしている。
この露出状態は、別個のポストホック構造回復モジュールなしでアタッチメントバリデーション、遅延構造修復、ターゲット介入、制約付きシリアライゼーションをサポートする。
C2LT-3Dは、単一オブジェクトCADモデルを用いて学習し、オープンワールドのマルチコンポーネント資産でゼロショットの評価を行い、構造的ロバスト性を改善し、その潜伏変数が敵のアタッチメント設定下で動作可能であることを示す。
これらの結果から, オープンワールド3次元生成表現は, 再構成忠実度だけでなく, 個々の状態が組立レベルの構造的推論に有効であるかどうかによって評価されるべきであることが示唆された。
関連論文リスト
- Mind the Gap: Geometrically Accurate Generative Reconstruction from Disjoint Views [0.8435195043404353]
本稿では,新たなパラダイムとして,不随意視点からの生成的再構築を紹介する。
提案するGLADOSは,3段階にわたって動作する汎用モジュール型フレームワークである。
アーキテクチャに依存しないフレームワークとして、GLADOSは、生成、再構築、塗装における将来の進歩のシームレスな統合を可能にする。
論文 参考訳(メタデータ) (2026-05-08T10:24:23Z) - Continuous Expert Assembly: Instance-Conditioned Low-Rank Residuals for All-in-One Image Restoration [41.34371852767098]
CEAは、オールインワン画像復元のためのトークン単位の動的パラメータ化フレームワークである。
CEAは、強力なプロンプト、ディスクリプタ、エキスパートベースのベースラインよりも平均的な復元品質を改善します。
論文 参考訳(メタデータ) (2026-05-07T12:31:24Z) - LG-HCC: Local Geometry-Aware Hierarchical Context Compression for 3D Gaussian Splatting [77.81227097905865]
アンカーベースの3DGS圧縮スキームは、いくつかの高度な文脈モデルを通してガウスの冗長性を減少させる。
本稿では, アンカープルーニングとエントロピー符号化にアンカー幾何学的相関を組み込んだ3DGSのための局所幾何学的階層型コンテキスト圧縮フレームワークを提案する。
実験の結果、LG-HCCは構造保存の問題を効果的に緩和し、Mip-NeRF360データセット上のScaffold-GSベースラインと比較して最大30.85倍のストレージを削減した。
論文 参考訳(メタデータ) (2026-03-30T13:39:35Z) - SARe: Structure-Aware Large-Scale 3D Fragment Reassembly [14.2680020647518]
3Dフラグメントの再組み立ては、共通のオブジェクト座標系において、秩序のないフラグメントポイント雲やメッシュの剛性的なポーズを復元することを目的としている。
既存のエンドツーエンドアプローチは、信頼できない接触推論のために障害をカスケードする傾向がある。
本研究では、ユークリッド空間アセンブリ生成のためのSARe-Genと推論時間改善のためのSARe-Refineを用いた生成フレームワークであるStructure-Aware Reassembly(SARe)を提案する。
論文 参考訳(メタデータ) (2026-03-23T06:13:14Z) - CEI-3D: Collaborative Explicit-Implicit 3D Reconstruction for Realistic and Fine-Grained Object Editing [51.73433734209541]
既存の3D編集手法は、再構成ネットワークの深い統合性のために、非現実的で未精細な結果をもたらすことが多い。
本稿では,現実的できめ細かな編集を容易にするための,編集指向の再構築パイプラインであるCEI-3Dを紹介する。
提案手法は,最新技術(SOTA)手法よりも,よりリアルできめ細かな編集結果を実現すると同時に,編集時間を短縮する。
論文 参考訳(メタデータ) (2026-03-12T11:15:11Z) - StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。
最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。
結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文 参考訳(メタデータ) (2026-01-12T15:41:27Z) - LoG3D: Ultra-High-Resolution 3D Shape Modeling via Local-to-Global Partitioning [26.88556500272625]
非符号距離場(UDF)に基づく新しい3次元変分オートエンコーダフレームワークを提案する。
私たちの中心となるイノベーションは、UDFを統一サブボリュームであるUBlockに分割することで処理する、ローカルからグローバルなアーキテクチャです。
再現精度と生成品質の両面での最先端性能を実証し,表面の滑らかさと幾何学的柔軟性を向上した。
論文 参考訳(メタデータ) (2025-11-13T07:34:43Z) - Light-SQ: Structure-aware Shape Abstraction with Superquadrics for Generated Meshes [60.92139345612904]
我々は、新しいスーパークワッドリックベースの最適化フレームワークLight-SQを提案する。
本稿では,構造対応ボリューム分解によるブロック再配置戦略を提案する。
実験によると、Light-SQはスーパークワッドリックで効率よく、高忠実で、編集可能な形状の抽象化を可能にする。
論文 参考訳(メタデータ) (2025-09-29T16:18:32Z) - Unsupervised Learning of Intrinsic Structural Representation Points [50.92621061405056]
3次元形状の学習構造は、コンピュータグラフィックスと幾何学処理の分野における根本的な問題である。
本稿では,3次元構造点の形で新しい構造表現を学習するための簡易かつ解釈不能な手法を提案する。
論文 参考訳(メタデータ) (2020-03-03T17:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。