Fugu-MT 論文翻訳(概要): Visual Sculpting: Visually-Aligned Planning Representations for Long-Horizon Robot Clay Sculpting

論文の概要: Visual Sculpting: Visually-Aligned Planning Representations for Long-Horizon Robot Clay Sculpting

arxiv url: http://arxiv.org/abs/2605.17556v1
Date: Sun, 17 May 2026 17:37:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-19 17:57:48.191258
Title: Visual Sculpting: Visually-Aligned Planning Representations for Long-Horizon Robot Clay Sculpting
Title（参考訳）: ビジュアル・スカルプチング:長軸ロボットクレイ・スカルプチングのための視覚的アラインな計画表現
Authors: Peter Schaldenbrand, Jean Oh,
Abstract要約: 本稿では、変形可能な材料の力学をモデル化し、視覚的に整列した表現でロボット彫刻を計画する手法を提案する。我々の行動は1つのエンドエフェクターで粘土にパラメタライズされたプッシュとして表現され、これは長方形(>100アクション)粘土レリーフ彫刻に適していることが証明された。
参考スコア（独自算出の注目度）: 12.937086930403671
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Clay sculpting is a nuanced, artistic task involving dexterous manipulation with long-horizon planning to achieve high-level goals. As a robotics problem, we formulate clay sculpting as a shape-to-shape matching challenge. Prior deformable object manipulation work either requires retraining a policy per goal or relies on dynamics models which represent state as sparse point clouds which do not capture important clay features, such as textures, well. We present a method for modeling the dynamics of deformable materials and planning for robotic sculpting in a representation that is visually-aligned, capturing lighting and texture features. With three different deformable materials and various end-effectors, we demonstrate that our dynamics model is comparable in performance to the state-of-the-art with the added benefit of being compatible with visual planning. Our actions are represented as parametrized pushes into clay with a single end-effector, which proved to be suitable for long-horizon (>100 actions) clay relief sculptures. Lastly, we show the benefits of planning in a visually-aligned representation, but also provide analysis providing evidence as to why this representation is challenging to plan in compared to 3D representations.
Abstract（参考訳）: 粘土彫刻は、高水準の目標を達成するための長い水平計画による厳密な操作を含む、繊細で芸術的な仕事である。ロボット工学の問題として、我々は粘土彫刻を形状と形状のマッチングチャレンジとして定式化する。事前の変形可能なオブジェクト操作作業では、目標ごとのポリシーの再トレーニングが必要か、あるいはテクスチャのような重要な粘土の特徴を捉えないスパースポイントクラウドとして状態を表すダイナミックスモデルに依存している。本稿では、変形可能な材料の力学をモデル化し、視覚的に整列した表現でロボット彫刻を計画し、照明とテクスチャの特徴を捉える方法を提案する。 3つの異なる変形可能な材料と様々なエンドエフェクタにより、我々の力学モデルは、ビジュアルプランニングと互換性のある利点を付加して、最先端技術に匹敵する性能を示す。我々の行動は1つのエンドエフェクターで粘土にパラメタライズされたプッシュとして表現され、これは長方形(>100アクション)粘土レリーフ彫刻に適していることが証明された。最後に、視覚的に整列した表現における計画の利点を示すとともに、なぜこの表現が3次元表現と比較して計画が難しいのかを示す証拠を提供する。

関連論文リスト

SculptDiff: Learning Robotic Clay Sculpting from Humans with Goal Conditioned Diffusion Policy [6.937243101289336]
SculptDiffは、目標条件付き拡散に基づく模倣学習フレームワークである。点雲状態の観測と連動して、様々なターゲット形状の粘土彫刻ポリシーを学ぶ。我々の知る限りでは、これが3次元変形可能なオブジェクトの操作ポリシーをうまく学習する最初の実世界の方法である。
論文参考訳（メタデータ） (2024-03-15T15:34:59Z)
TriHuman : A Real-time and Controllable Tri-plane Representation for Detailed Human Geometry and Appearance Synthesis [76.73338151115253]
TriHumanは、人間によって調整され、変形可能で、効率的な三面体表現である。我々は、未変形の三面体テクスチャ空間に、地球規模のサンプルを厳格にワープする。このような三面的特徴表現が骨格運動でどのように条件付けされ、動的外観や幾何学的変化を考慮に入れられるかを示す。
論文参考訳（メタデータ） (2023-12-08T16:40:38Z)
SculptBot: Pre-Trained Models for 3D Deformable Object Manipulation [8.517406772939292]
粘土やパン生地のモデリングなどの塑性挙動を示す材料は, 応力下で永久に変形し, 常に形状が変化するため, 状態表現は困難である。本研究では,点雲を状態表現として利用し,事前学習した点雲再構成変換器を用いて潜時力学モデルを学習し,把持動作による材料変形を予測するシステムを提案する。
論文参考訳（メタデータ） (2023-09-15T19:27:44Z)
Mesh-Tension Driven Expression-Based Wrinkles for Synthetic Faces [6.098254376499899]
我々は,表情に反応して皮膚のダイナミックなしわを導入することで,合成顔のリアリズムを高める。私たちの重要な貢献は、デジタル人間の多様で多様な集団に現実的なしわを生み出すアプローチです。また,300Wウィンクス評価サブセットとクローズドアイとウィンクのペクセルデータセットも導入した。
論文参考訳（メタデータ） (2022-10-05T18:00:13Z)
Drivable Volumetric Avatars using Texel-Aligned Features [52.89305658071045]
光テレプレゼンスは、動的に合成された外観を実現するために、高忠実度ボディモデリングと忠実な運転の両方を必要とする。本稿では,現実人のフルボディアバターをモデリングし,駆動する際の2つの課題に対処するエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (2022-07-20T09:28:16Z)
3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文参考訳（メタデータ） (2021-07-08T17:49:37Z)
Real-time Deep Dynamic Characters [95.5592405831368]
本研究では,高度にリアルな形状,動き,ダイナミックな外観を示す3次元人物モデルを提案する。我々は,新しいグラフ畳み込みネットワークアーキテクチャを用いて,身体と衣服の運動依存的変形学習を実現する。本モデルでは, 運動依存的表面変形, 物理的に妥当な動的衣服変形, および映像現実的表面テクスチャを, 従来よりも細部まで高レベルに生成することを示す。
論文参考訳（メタデータ） (2021-05-04T23:28:55Z)
Weakly Supervised Learning of Multi-Object 3D Scene Decompositions Using Deep Shape Priors [69.02332607843569]
PriSMONetは、単一画像から多目的3Dシーンの分解と表現を学習するための新しいアプローチである。リカレントエンコーダは、入力されたRGB画像から、各オブジェクトの3D形状、ポーズ、テクスチャの潜時表現を回帰する。我々は,3次元シーンレイアウトの推測におけるモデルの精度を評価し,その生成能力を実証し,実画像への一般化を評価し,学習した表現の利点を指摘する。
論文参考訳（メタデータ） (2020-10-08T14:49:23Z)
Learning to Caricature via Semantic Shape Transform [95.25116681761142]
本稿では,意味的形状変換に基づくアルゴリズムを提案する。提案手法は,顔の構造を維持しつつ,視覚的に心地よい形状の誇張を表現できることを示す。
論文参考訳（メタデータ） (2020-08-12T03:41:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。