論文の概要: JODA: Composable Joint Dynamics for Articulated Objects
- arxiv url: http://arxiv.org/abs/2605.09954v1
- Date: Mon, 11 May 2026 04:02:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.508067
- Title: JODA: Composable Joint Dynamics for Articulated Objects
- Title(参考訳): JODA:Articulated Objectsのための構成可能なジョイントダイナミクス
- Authors: Tianhong Gao, Cheng Yu, Yinghao Xu, Mengyu Chu,
- Abstract要約: JODAは、ジョイントレベルダイナミクスを、ジョイントレベルの自由度を越えて構造化された3チャンネルフィールドとして生成するためのフレームワークである。
それは、解釈可能かつ微分可能シミュレーションと互換性のあるコンパクトかつ表現的関数空間を定義する。
JODAは多種多様な関節行動の可塑性かつ制御可能なモデリングを可能にし,推論,編集,最適化のための統一インターフェースを提供する。
- 参考スコア(独自算出の注目度): 17.60725863703415
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Articulated objects used in simulation and embodied AI are typically specified by geometry and kinematic structure, but lack the fine-grained dynamical effects that govern realistic mechanical behavior, such as frictional holding, detents, soft closing, and snap latching. Existing approaches either ignore the detailed structure of dynamics entirely, or use simple models with limited expressiveness. We introduce JODA, a framework for generating joint-level dynamics as a structured three-channel field over the joint degree of freedom, capturing conservative forces, dry friction, and damping. Instantiated using shape-constrained piecewise cubic interpolation (PCHIP), this formulation defines a compact and expressive function space that is both interpretable and compatible with differentiable simulation. Building on this representation, we develop methods for inferring and refining joint dynamics from multimodal inputs. Given visual observations and joint context, a vision-language model proposes structured dynamical primitives, which are composed into a unified dynamics field. The resulting representation supports both direct manipulation and gradient-based refinement. We demonstrate that JODA enables plausible and controllable modeling of diverse joint behaviors, providing a unified interface for inference, editing, and optimization. Code and example assets with their generated profiles will be released upon publication.
- Abstract(参考訳): シミュレーションやAIの具体化に使用される人工物体は、一般的に幾何学や運動学的な構造によって特定されるが、摩擦保持、象牙質、ソフトクローゼット、スナップラッチといった現実的な機械的挙動を規定する微細な力学効果は欠如している。
既存のアプローチは、ダイナミクスの詳細な構造を完全に無視するか、あるいは表現力に制限のある単純なモデルを使用する。
本稿では, 自由度, 保守力, ドライ摩擦, ダンピングの3チャンネル構造体として, ジョイントレベルダイナミクスを生成するためのフレームワークJODAを紹介する。
この定式化はPCHIP (form-constrained piecewise cubic interpolation) を用いて、解釈可能かつ微分可能なシミュレーションと互換性のあるコンパクトかつ表現可能な関数空間を定義する。
この表現に基づいて,マルチモーダル入力から関節力学を推定・精錬する手法を開発した。
視覚的観察と共同文脈が与えられた場合、視覚言語モデルは、統一された力学場を構成する構造化された動的プリミティブを提案する。
結果として得られる表現は、直接操作と勾配ベースの洗練の両方をサポートする。
JODAは多種多様な関節行動の可塑性かつ制御可能なモデリングを可能にし,推論,編集,最適化のための統一インターフェースを提供する。
生成されたプロファイルを持つコードとサンプルアセットは、公開時に公開される。
関連論文リスト
- D-Prism: Differentiable Primitives for Structured Dynamic Modeling [46.22518390136366]
D-Prismは、微分可能なプリミティブを動的ドメインに拡張することで、高忠実な構造化された動的モデリングを実現する最初のフレームワークである。
プリミティブな動きを制御するための変形ネットワークを導入し、物体の動きを正確に一致させる。
実験により,本手法は構造的動的モデリングに優れ,構造的幾何と高精度な運動追跡の両方を提供することを確認した。
論文 参考訳(メタデータ) (2026-04-18T17:39:47Z) - A Unified Low-Dimensional Design Embedding for Joint Optimization of Shape, Material, and Actuation in Soft Robots [4.829343342713712]
形状変形,多材料分布,アクチュエータを統一したソフトロボットのためのスムーズで低次元な設計埋め込みを提案する。
実験では、ニューラルネットワークの符号化と異なり、基礎関数の数に応じて設計が増加することを示す。
さらに, 一体型埋め込みによる形状, 材料, アクティベーションの協調最適化は, 逐次戦略を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-03-06T17:33:32Z) - ArtGen: Conditional Generative Modeling of Articulated Objects in Arbitrary Part-Level States [9.721009445297716]
ArtGenは、正確な幾何学とコヒーレント・キネマティクスを備えた3Dオブジェクトを生成することができる条件付き拡散ベースのフレームワークである。
具体的には、ArtGenはグローバルキネマティック一貫性を明示的に実施するために、クロスステートなMonte Carloサンプリングを使用している。
合成3D-VAE潜伏剤は局所的言語的注意に先行して強化され、微細な幾何学的関係と大域的部分的関係を効果的に捉える。
論文 参考訳(メタデータ) (2025-12-13T17:00:03Z) - Interaction-Aware 4D Gaussian Splatting for Dynamic Hand-Object Interaction Reconstruction [19.178735596766476]
本稿では,物体の先行を伴わない手動物体の形状と外観を同時にモデル化する難易度設定に焦点をあてる。
我々は、より明確な構造表現のために、一意に線形な仮説を採用することを目的とした、新しく導入された最適化可能なパラメータを持つ対話型手対象ガウスについて述べる。
実験により,本手法は既存の動的3D-GS法を超越し,動的手動物体相互作用の再構築における最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-11-18T14:44:04Z) - Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects [59.51185639557874]
本稿では,任意のRGB画像やテキスト記述から直接音声オブジェクトを合成するフレームワークであるKinematifyを紹介する。
提案手法は, 高DoFオブジェクトに対する運動的トポロジの推測と静的幾何からの関節パラメータの推定という2つの課題に対処する。
論文 参考訳(メタデータ) (2025-11-03T07:21:42Z) - ArtiLatent: Realistic Articulated 3D Object Generation via Structured Latents [31.495577251319315]
ArtiLatentは、人間の作った3Dオブジェクトを精密な幾何学、正確な調音、リアルな外観で合成する生成フレームワークである。
論文 参考訳(メタデータ) (2025-10-24T13:08:15Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.77347895550087]
JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。
私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。
提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文 参考訳(メタデータ) (2024-12-29T14:18:35Z) - Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations [56.78271181959529]
GAM(Generalized Additive Models)は、変数とターゲットの間の非線形関係をキャプチャできるが、複雑な特徴相互作用をキャプチャすることはできない。
本稿では,GAMのフレキシブルな形状関数と,数学的表現に見られる複雑な特徴相互作用を融合させる形状表現算術(SHARE)を提案する。
また、標準制約を超えた表現の透明性を保証するSHAREを構築するための一連のルールを設計する。
論文 参考訳(メタデータ) (2024-04-15T13:44:01Z) - Euclideanizing Flows: Diffeomorphic Reduction for Learning Stable
Dynamical Systems [74.80320120264459]
本研究では、限られた数の人間の実演からそのような動きを学ぶためのアプローチを提案する。
複素運動は安定な力学系のロールアウトとして符号化される。
このアプローチの有効性は、確立されたベンチマーク上での検証と、現実世界のロボットシステム上で収集されたデモによって実証される。
論文 参考訳(メタデータ) (2020-05-27T03:51:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。