論文の概要: CulinaryCut-VLAP: A Vision-Language-Action-Physics Framework for Food Cutting via a Force-Aware Material Point Method
- arxiv url: http://arxiv.org/abs/2601.06451v1
- Date: Sat, 10 Jan 2026 06:35:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.821273
- Title: CulinaryCut-VLAP: A Vision-Language-Action-Physics Framework for Food Cutting via a Force-Aware Material Point Method
- Title(参考訳): CulinaryCut-VLAP:フォース・アウェア・マテリアルポイント法による食品切削のためのビジョン・ランゲージ・アクション・物理フレームワーク
- Authors: Hyunseo Koh, Chang-Yong Song, Youngjae Choi, Misa Viveiros, David Hyde, Heewon Kim,
- Abstract要約: 本稿では,視覚言語アクション(VLA)データセットと物質点法(MPM)に基づく物理的に現実的な切削シミュレータを結合した統合フレームワークを提案する。
我々のシミュレータはMLS-MPMを計算コアとして採用し、トポロジー変化によるカットでも回転・せん断応答を保ちながら、数値散逸とエネルギードリフトを低減する。
また、多様な切断軌跡、多視点視覚観察、きめ細かい言語命令を統合するベンチマークデータセットも提供する。
- 参考スコア(独自算出の注目度): 15.122135076461978
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Food cutting is a highly practical yet underexplored application at the intersection of vision and robotic manipulation. The task remains challenging because interactions between the knife and deformable materials are highly nonlinear and often entail large deformations, frequent contact, and topological change, which in turn hinder stable and safe large-scale data collection. To address these challenges, we propose a unified framework that couples a vision-language-action (VLA) dataset with a physically realistic cutting simulator built on the material point method (MPM). Our simulator adopts MLS-MPM as its computational core, reducing numerical dissipation and energy drift while preserving rotational and shear responses even under topology-changing cuts. During cutting, forces and stress distributions are estimated from impulse exchanges between particles and the grid, enabling stable tracking of transient contact forces and energy transfer. We also provide a benchmark dataset that integrates diverse cutting trajectories, multi-view visual observations, and fine-grained language instructions, together with force--torque and tool--pose labels to provide physically consistent training signals. These components realize a learning--evaluation loop that respects the core physics of cutting and establishes a safe, reproducible, and scalable foundation for advancing VLA models in deformable object manipulation.
- Abstract(参考訳): 食品切削は、視覚とロボット操作の交差点において、非常に実用的だが未発見の応用である。
この課題は、ナイフと変形可能な材料の間の相互作用が非常に非線形であり、しばしば大きな変形、頻繁な接触、トポロジカルな変化を伴い、安定かつ安全な大規模データ収集を妨げるため、依然として困難である。
これらの課題に対処するために,視覚言語アクション(VLA)データセットと物質点法(MPM)上に構築された物理的に現実的な切削シミュレータを結合した統合フレームワークを提案する。
我々のシミュレータはMLS-MPMを計算コアとして採用し、トポロジー変化によるカットでも回転・せん断応答を保ちながら、数値散逸とエネルギードリフトを低減する。
切断中、粒子と格子の間のインパルス交換から力と応力の分布を推定し、過渡的な接触力とエネルギー移動の安定した追跡を可能にする。
また、様々な切断軌跡、多視点視覚観察、きめ細かな言語指示、および力トルクとツール配置ラベルを統合し、物理的に一貫したトレーニング信号を提供するベンチマークデータセットを提供する。
これらのコンポーネントは、カットのコア物理を尊重し、変形可能なオブジェクト操作においてVLAモデルを進化させるための安全で再現可能なスケーラブルな基盤を確立する学習評価ループを実現する。
関連論文リスト
- ByteLoom: Weaving Geometry-Consistent Human-Object Interactions through Progressive Curriculum Learning [19.292101162897975]
本稿では,幾何的に一貫したオブジェクト図面を持つ実写HOIビデオを生成するByteLoomを紹介する。
まず、相対座標マップ(RCM)をオブジェクトの幾何整合性を維持する普遍表現として活用するRCM-cache機構を提案する。
次に、モデル能力を進歩的なスタイルで向上し、ハンドメッシュの需要を緩和するトレーニングカリキュラムを設計する。
論文 参考訳(メタデータ) (2025-12-28T09:38:36Z) - Learning Deformable Body Interactions With Adaptive Spatial Tokenization [7.74274240680049]
変形可能な物体間の相互作用のシミュレーションは、材料科学、機械設計、ロボット工学などの分野において不可欠である。
オブジェクト間の相互作用をモデル化するには、ペアワイズなグローバルエッジを動的に作成する必要がある。
物理的状態の効率的な表現のための適応的空間トークン化(AST)手法を提案する。
論文 参考訳(メタデータ) (2025-07-18T07:27:35Z) - Physics-Encoded Graph Neural Networks for Deformation Prediction under
Contact [87.69278096528156]
ロボット工学では、触覚相互作用における物体の変形を理解することが不可欠である。
本稿では,物理符号化グラフニューラルネットワーク(GNN)を用いた予測手法を提案する。
コードとデータセットを公開して、ロボットシミュレーションと把握の研究を進めました。
論文 参考訳(メタデータ) (2024-02-05T19:21:52Z) - Learning Flexible Body Collision Dynamics with Hierarchical Contact Mesh Transformer [19.042551780033765]
階層型メッシュ構造を用いて長距離依存を学習可能な階層型コンタクトメッシュトランス(HCMT)を提案する。
HCMTは長距離相互作用を可能にし、階層メッシュ構造はすぐに遠くの位置への衝突効果を伝播させる。
その結果,HCMTは既存の手法に比べて大幅な性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2023-12-19T05:30:08Z) - DeepSimHO: Stable Pose Estimation for Hand-Object Interaction via
Physics Simulation [81.11585774044848]
我々は、前方物理シミュレーションと後方勾配近似とニューラルネットワークを組み合わせた新しいディープラーニングパイプラインであるDeepSimHOを紹介する。
提案手法は, 評価の安定性を著しく向上し, テスト時間最適化よりも優れた効率性を実現する。
論文 参考訳(メタデータ) (2023-10-11T05:34:36Z) - gradSim: Differentiable simulation for system identification and
visuomotor control [66.37288629125996]
本稿では,微分可能マルチフィジカルシミュレーションと微分可能レンダリングを活用し,3次元監督への依存を克服するフレームワークであるgradsimを提案する。
当社の統合グラフは、状態ベースの(3D)監督に頼ることなく、挑戦的なバイスモメータ制御タスクで学習を可能にします。
論文 参考訳(メタデータ) (2021-04-06T16:32:01Z) - Tracking Partially-Occluded Deformable Objects while Enforcing Geometric
Constraints [11.247580943940916]
我々は、変形可能な物体の追跡を支援するために、高忠実度物理シミュレーションを構築した。
我々はRGBD画像と幾何運動推定に基づいてオブジェクトに焦点を当てる。
コントリビューションにより、従来の手法よりも精度の面で大きなマージンを達成できます。
論文 参考訳(メタデータ) (2020-11-01T21:13:18Z) - Scalable Differentiable Physics for Learning and Control [99.4302215142673]
微分物理学は、物理的対象や環境を含む問題を学習し、制御するための強力なアプローチである。
我々は、多数のオブジェクトとその相互作用をサポートすることができる微分可能物理学のためのスケーラブルなフレームワークを開発する。
論文 参考訳(メタデータ) (2020-07-04T19:07:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。