論文の概要: Guiding Diffusion-Based Articulated Object Generation by Partial Point Cloud Alignment and Physical Plausibility Constraints
- arxiv url: http://arxiv.org/abs/2508.00558v1
- Date: Fri, 01 Aug 2025 11:56:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-04 18:08:53.864924
- Title: Guiding Diffusion-Based Articulated Object Generation by Partial Point Cloud Alignment and Physical Plausibility Constraints
- Title(参考訳): 部分点雲配向と物理可視性制約による拡散に基づく有声物体の誘導
- Authors: Jens U. Kreber, Joerg Stueckler,
- Abstract要約: 本稿では,新しい拡散モデルに基づく音声オブジェクト生成手法であるPhysNAPを提案する。
予測SDFを用いて計算した点雲アライメント損失を用いて逆拡散過程を導出する。
また、より物理的に妥当なオブジェクトを生成するために、モデルを誘導する部分SDFに基づいて、非ペネティフィケーションとモビリティの制約を課す。
- 参考スコア(独自算出の注目度): 6.523036096130658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Articulated objects are an important type of interactable objects in everyday environments. In this paper, we propose PhysNAP, a novel diffusion model-based approach for generating articulated objects that aligns them with partial point clouds and improves their physical plausibility. The model represents part shapes by signed distance functions (SDFs). We guide the reverse diffusion process using a point cloud alignment loss computed using the predicted SDFs. Additionally, we impose non-penetration and mobility constraints based on the part SDFs for guiding the model to generate more physically plausible objects. We also make our diffusion approach category-aware to further improve point cloud alignment if category information is available. We evaluate the generative ability and constraint consistency of samples generated with PhysNAP using the PartNet-Mobility dataset. We also compare it with an unguided baseline diffusion model and demonstrate that PhysNAP can improve constraint consistency and provides a tradeoff with generative ability.
- Abstract(参考訳): アーティキュレートされたオブジェクトは、日々の環境において、対話可能なオブジェクトの重要なタイプである。
本稿では,PhysNAPを提案する。PhysNAPは,物体を部分点雲に整列させ,その物理的妥当性を向上する,新しい拡散モデルに基づくオブジェクト生成手法である。
このモデルは、符号付き距離関数(SDF)による部分形状を表す。
予測SDFを用いて計算した点雲アライメント損失を用いて逆拡散過程を導出する。
さらに、より物理的に妥当なオブジェクトを生成するために、モデルを誘導する部分SDFに基づいて、非ペネティフィケーションおよびモビリティ制約を課す。
また、カテゴリ情報が利用可能であれば、さらにポイントクラウドアライメントを改善するために、拡散アプローチのカテゴリを意識する。
本研究では、PhysNAPで生成されたサンプルの生成能力と制約一貫性をPartNet-Mobilityデータセットを用いて評価した。
また、非誘導ベースライン拡散モデルと比較し、PhysNAPが制約の整合性を改善し、生成能力とのトレードオフを提供することを示した。
関連論文リスト
- SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。
SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。
画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文 参考訳(メタデータ) (2024-08-19T17:32:15Z) - Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文 参考訳(メタデータ) (2024-02-27T08:47:19Z) - Implicit Modeling of Non-rigid Objects with Cross-Category Signals [28.956412015920936]
MODIFは、複数のオブジェクトに対する変形フィールドとインスタンス固有の潜時符号を同時に学習する多目的深い暗黙関数である。
我々は,MODIFが各臓器の形状表現と他臓器との関係を良好に学習できることを示す。
論文 参考訳(メタデータ) (2023-12-15T22:34:17Z) - Robustifying Generalizable Implicit Shape Networks with a Tunable
Non-Parametric Model [10.316008740970037]
無向点雲からの暗黙的形状再構成の一般化可能なモデルは一般化問題に悩まされる。
ここでは、これらの制限のいくつかをテスト時に緩和する効率的なメカニズムを提案する。
本稿では,本手法によるベースラインの改良と,合成データと実データを用いた最先端技術について述べる。
論文 参考訳(メタデータ) (2023-11-21T20:12:29Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - Controllable Mesh Generation Through Sparse Latent Point Diffusion
Models [105.83595545314334]
メッシュ生成のための新しいスパース潜在点拡散モデルを設計する。
私たちの重要な洞察は、ポイントクラウドをメッシュの中間表現と見なし、代わりにポイントクラウドの分布をモデル化することです。
提案したスパース潜在点拡散モデルにより,生成品質と制御性において優れた性能が得られる。
論文 参考訳(メタデータ) (2023-03-14T14:25:29Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - Attention-based Transformation from Latent Features to Point Clouds [6.547680885781582]
AXformは、潜在機能をポイントクラウドに変換するための注意ベースの手法である。
パラメータ共有とデータフローの両方を考慮しており、アウトレーヤが減り、ネットワークパラメータが減り、コンバージェンス速度が速くなる。
AXformは強い2次元の制約を持たず、非滑らかな曲面の生成を改善する。
異なるデータセットに対する検討実験により,本手法が最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2021-12-10T03:59:04Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Representing Point Clouds with Generative Conditional Invertible Flow
Networks [15.280751949071016]
クラウド固有の確率分布から抽出したサンプルの集合として,点雲を表現するための簡易かつ効果的な方法を提案する。
提案手法は, 生成的非可逆フローネットワークを利用して埋め込みを学習し, 点雲を生成する。
私たちのモデルは、ベンチマークデータセット上で、競争力または優れた定量的結果を提供します。
論文 参考訳(メタデータ) (2020-10-07T18:30:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。