論文の概要: ShapeLib: designing a library of procedural 3D shape abstractions with Large Language Models
- arxiv url: http://arxiv.org/abs/2502.08884v1
- Date: Thu, 13 Feb 2025 01:52:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:49:25.608998
- Title: ShapeLib: designing a library of procedural 3D shape abstractions with Large Language Models
- Title(参考訳): ShapeLib: 大規模言語モデルを用いた手続き型3次元形状抽象化ライブラリの設計
- Authors: R. Kenny Jones, Paul Guerrero, Niloy J. Mitra, Daniel Ritchie,
- Abstract要約: 本稿では,3次元形状抽象化関数のライブラリであるShapeLibを紹介する。
我々は、異なる視覚的モダリティからライブラリーに基づいて形状プログラムを推論する認識ネットワークを訓練する。
我々の形状関数は意味論的に解釈可能なパラメータを持ち、可変な形状変化を生成するために修正することができる。
- 参考スコア(独自算出の注目度): 46.372361125013974
- License:
- Abstract: Procedural representations are desirable, versatile, and popular shape encodings. Authoring them, either manually or using data-driven procedures, remains challenging, as a well-designed procedural representation should be compact, intuitive, and easy to manipulate. A long-standing problem in shape analysis studies how to discover a reusable library of procedural functions, with semantically aligned exposed parameters, that can explain an entire shape family. We present ShapeLib as the first method that leverages the priors of frontier LLMs to design a library of 3D shape abstraction functions. Our system accepts two forms of design intent: text descriptions of functions to include in the library and a seed set of exemplar shapes. We discover procedural abstractions that match this design intent by proposing, and then validating, function applications and implementations. The discovered shape functions in the library are not only expressive but also generalize beyond the seed set to a full family of shapes. We train a recognition network that learns to infer shape programs based on our library from different visual modalities (primitives, voxels, point clouds). Our shape functions have parameters that are semantically interpretable and can be modified to produce plausible shape variations. We show that this allows inferred programs to be successfully manipulated by an LLM given a text prompt. We evaluate ShapeLib on different datasets and show clear advantages over existing methods and alternative formulations.
- Abstract(参考訳): 手続き表現は望ましい、汎用的で、人気のある形状符号化である。
手動またはデータ駆動のプロシージャを使用するオーサリングは依然として困難であり、適切に設計された手続き表現はコンパクトで直感的で操作が容易であるべきである。
形状解析における長年の問題として、意味的に整合した露出パラメータを持つ手続き関数の再利用ライブラリの発見方法が研究されている。
本稿では,フロンティアLLMの先行技術を利用して3次元形状抽象化関数のライブラリを設計する手法としてShapeLibを提案する。
本システムでは,ライブラリに含める関数のテキスト記述と,典型的な形状のシードセットという,2種類の設計意図を受け入れている。
我々は,この設計意図に合致する手続き的抽象化を,アプリケーションや実装の提案,検証,検証によって発見する。
ライブラリーで発見された形状関数は表現的であるだけでなく、シードセットを超えて完全な形状の族に一般化する。
認識ネットワークをトレーニングし、異なる視覚的モダリティ(プリミティブ、ボクセル、ポイントクラウド)から、ライブラリに基づいて形状プログラムを推論する。
我々の形状関数は意味論的に解釈可能なパラメータを持ち、可変な形状変化を生成するために修正することができる。
これにより、テキストプロンプトが与えられたLLMによって、推論されたプログラムをうまく操作できることが示される。
異なるデータセット上でShapeLibを評価し、既存の方法や代替の定式化に対して明確な優位性を示す。
関連論文リスト
- ShapeCoder: Discovering Abstractions for Visual Programs from
Unstructured Primitives [44.01940125080666]
形状のデータセットを非構造化プリミティブで表現できる最初のシステムであるShapeCoderを提案する。
ShapeCoderは、ハイレベルな関係をキャプチャし、外部自由度を排除し、より良いデータセット圧縮を実現する抽象化ライブラリの発見方法を示す。
論文 参考訳(メタデータ) (2023-05-09T17:55:48Z) - PatchRD: Detail-Preserving Shape Completion by Learning Patch Retrieval
and Deformation [59.70430570779819]
本稿では,3次元形状の欠落領域の幾何学的詳細化に焦点を当てたデータ駆動型形状補完手法を提案する。
私たちの重要な洞察は、部分的な入力から完全な欠落したリージョンへのパッチのコピーとデフォームです。
部分的な入力からパッチを抽出することで繰り返しパターンを活用し、ニューラルネットワークを用いてグローバルな構造的先行点を学習し、検索と変形の手順を導出する。
論文 参考訳(メタデータ) (2022-07-24T18:59:09Z) - Towards Implicit Text-Guided 3D Shape Generation [81.22491096132507]
本研究は,テキストから3次元形状を生成するという課題について考察する。
テキスト記述にマッチする色で高忠実な形状を生成できるテキスト誘導型3次元形状生成のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-28T10:20:03Z) - ShapeMOD: Macro Operation Discovery for 3D Shape Programs [41.973945628565104]
3Dシェイププログラムの大規模なデータセットで有用なマクロを自動的に発見するアルゴリズムであるShapeMODを紹介します。
ShapeMODは命令型ステートメントベースの言語で表現された形状プログラムで動作する。
構造的およびパラメトリックなパターンを抽象化するマクロの簡潔なセットを自動的に発見することを示した。
論文 参考訳(メタデータ) (2021-04-13T17:54:03Z) - ShapeAssembly: Learning to Generate Programs for 3D Shape Structure
Synthesis [38.27280837835169]
本研究では,3次元形状構造のためのドメイン固有の「アセンブリ言語」であるShapeAssemblyを提案する。
PartNetデータセットの既存の形状構造からShapeAssemblyプログラムを抽出する方法を示す。
生成したプログラムから出力される形状を、他の最近の形状構造モデルと比較することにより、我々のアプローチを評価する。
論文 参考訳(メタデータ) (2020-09-17T02:26:45Z) - PatchNets: Patch-Based Generalizable Deep Implicit 3D Shape
Representations [75.42959184226702]
物体認識訓練のための中級パッチベースサーフェス表現を提案する。
形状や部分点雲の完全化など,新しい表現の応用例をいくつか紹介する。
論文 参考訳(メタデータ) (2020-08-04T15:34:46Z) - Learning Generative Models of Shape Handles [43.41382075567803]
ハンドセットとして3次元形状を合成する生成モデルを提案する。
我々のモデルは、様々な濃度と異なる種類のハンドルを持つハンドセットを生成することができる。
得られた形状表現は直感的であり,従来の最先端技術よりも優れた品質が得られることを示す。
論文 参考訳(メタデータ) (2020-04-06T22:35:55Z) - DualSDF: Semantic Shape Manipulation using a Two-Level Representation [54.62411904952258]
本稿では,2段階の粒度で形状を表現するDualSDFと,抽象化されたプロキシ形状を表すDualSDFを提案する。
我々の2段階モデルでは、ユーザが対話的に粗いプロキシの形状を操作でき、その変化を即座に高解像度の形状に反映できる新しい形状操作技術が生み出される。
論文 参考訳(メタデータ) (2020-04-06T17:59:15Z) - Deep Geometric Functional Maps: Robust Feature Learning for Shape
Correspondence [31.840880075039944]
非剛体3次元形状間の対応性を計算するための新しい学習手法を提案する。
提案手法の鍵となるのは, 生形状から直接学習する特徴抽出ネットワークである。
論文 参考訳(メタデータ) (2020-03-31T15:20:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。