論文の概要: CulinaryCut-VLAP: A Vision-Language-Action-Physics Framework for Food Cutting via a Force-Aware Material Point Method
- arxiv url: http://arxiv.org/abs/2601.06451v1
- Date: Sat, 10 Jan 2026 06:35:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.821273
- Title: CulinaryCut-VLAP: A Vision-Language-Action-Physics Framework for Food Cutting via a Force-Aware Material Point Method
- Title(参考訳): CulinaryCut-VLAP:フォース・アウェア・マテリアルポイント法による食品切削のためのビジョン・ランゲージ・アクション・物理フレームワーク
- Authors: Hyunseo Koh, Chang-Yong Song, Youngjae Choi, Misa Viveiros, David Hyde, Heewon Kim,
- Abstract要約: 本稿では,視覚言語アクション(VLA)データセットと物質点法(MPM)に基づく物理的に現実的な切削シミュレータを結合した統合フレームワークを提案する。
我々のシミュレータはMLS-MPMを計算コアとして採用し、トポロジー変化によるカットでも回転・せん断応答を保ちながら、数値散逸とエネルギードリフトを低減する。
また、多様な切断軌跡、多視点視覚観察、きめ細かい言語命令を統合するベンチマークデータセットも提供する。
- 参考スコア(独自算出の注目度): 15.122135076461978
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Food cutting is a highly practical yet underexplored application at the intersection of vision and robotic manipulation. The task remains challenging because interactions between the knife and deformable materials are highly nonlinear and often entail large deformations, frequent contact, and topological change, which in turn hinder stable and safe large-scale data collection. To address these challenges, we propose a unified framework that couples a vision-language-action (VLA) dataset with a physically realistic cutting simulator built on the material point method (MPM). Our simulator adopts MLS-MPM as its computational core, reducing numerical dissipation and energy drift while preserving rotational and shear responses even under topology-changing cuts. During cutting, forces and stress distributions are estimated from impulse exchanges between particles and the grid, enabling stable tracking of transient contact forces and energy transfer. We also provide a benchmark dataset that integrates diverse cutting trajectories, multi-view visual observations, and fine-grained language instructions, together with force--torque and tool--pose labels to provide physically consistent training signals. These components realize a learning--evaluation loop that respects the core physics of cutting and establishes a safe, reproducible, and scalable foundation for advancing VLA models in deformable object manipulation.
- Abstract(参考訳): 食品切削は、視覚とロボット操作の交差点において、非常に実用的だが未発見の応用である。
この課題は、ナイフと変形可能な材料の間の相互作用が非常に非線形であり、しばしば大きな変形、頻繁な接触、トポロジカルな変化を伴い、安定かつ安全な大規模データ収集を妨げるため、依然として困難である。
これらの課題に対処するために,視覚言語アクション(VLA)データセットと物質点法(MPM)上に構築された物理的に現実的な切削シミュレータを結合した統合フレームワークを提案する。
我々のシミュレータはMLS-MPMを計算コアとして採用し、トポロジー変化によるカットでも回転・せん断応答を保ちながら、数値散逸とエネルギードリフトを低減する。
切断中、粒子と格子の間のインパルス交換から力と応力の分布を推定し、過渡的な接触力とエネルギー移動の安定した追跡を可能にする。
また、様々な切断軌跡、多視点視覚観察、きめ細かな言語指示、および力トルクとツール配置ラベルを統合し、物理的に一貫したトレーニング信号を提供するベンチマークデータセットを提供する。
これらのコンポーネントは、カットのコア物理を尊重し、変形可能なオブジェクト操作においてVLAモデルを進化させるための安全で再現可能なスケーラブルな基盤を確立する学習評価ループを実現する。
関連論文リスト
- From Perception to Action: An Interactive Benchmark for Vision Reasoning [51.11355591375073]
Causal Hierarchy of Actions and Interactions (CHAIN)ベンチマークは、モデルが物理的制約に基づいて構造化されたアクションシーケンスを理解し、計画し、実行できるかを評価するために設計された。
CHAINは、受動的知覚からアクティブな問題解決、機械パズルのインターロックや3D積み重ね、パッキングといったタスクへと評価をシフトする。
以上の結果から,トップパフォーマンスモデルでは,物理構造や因果制約の内在化に苦慮し,信頼性の高い長期計画の作成に失敗することが多く,認識された構造を効果的に翻訳することができないことが示唆された。
論文 参考訳(メタデータ) (2026-02-24T15:33:02Z) - TRACER: Texture-Robust Affordance Chain-of-Thought for Deformable-Object Refinement [37.77903164878976]
TRACER は Texture-Robust Affordance Chain-of- Thought with dEformable-object Refinement framework である。
セマンティック推論から外見が損なわれ、物理的に一貫した機能領域の洗練まで、階層横断的なマッピングを提供する。
Fine-AGDDO15データセットと実世界のロボットプラットフォームで実施された実験は、TRACERが精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2026-01-28T03:12:18Z) - Grasp-and-Lift: Executable 3D Hand-Object Interaction Reconstruction via Physics-in-the-Loop Optimization [5.146238489510258]
デクサラスハンド操作は、正確にハンドオブジェクトの軌跡データを持つデータセットにますます依存している。
DexYCB や HO3D のような既存のリソースは主に視覚的アライメントに最適化されているが、物理シミュレーターでリプレイすると物理的に不可解な相互作用が生じることが多い。
本稿では,これらの視覚的に整列した軌道を物理的に有効な軌道に変換するシミュレーション・イン・ザ・ループ・リファインメント・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-26T04:08:30Z) - ByteLoom: Weaving Geometry-Consistent Human-Object Interactions through Progressive Curriculum Learning [19.292101162897975]
本稿では,幾何的に一貫したオブジェクト図面を持つ実写HOIビデオを生成するByteLoomを紹介する。
まず、相対座標マップ(RCM)をオブジェクトの幾何整合性を維持する普遍表現として活用するRCM-cache機構を提案する。
次に、モデル能力を進歩的なスタイルで向上し、ハンドメッシュの需要を緩和するトレーニングカリキュラムを設計する。
論文 参考訳(メタデータ) (2025-12-28T09:38:36Z) - Learning Deformable Body Interactions With Adaptive Spatial Tokenization [7.74274240680049]
変形可能な物体間の相互作用のシミュレーションは、材料科学、機械設計、ロボット工学などの分野において不可欠である。
オブジェクト間の相互作用をモデル化するには、ペアワイズなグローバルエッジを動的に作成する必要がある。
物理的状態の効率的な表現のための適応的空間トークン化(AST)手法を提案する。
論文 参考訳(メタデータ) (2025-07-18T07:27:35Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - Physics-Encoded Graph Neural Networks for Deformation Prediction under
Contact [87.69278096528156]
ロボット工学では、触覚相互作用における物体の変形を理解することが不可欠である。
本稿では,物理符号化グラフニューラルネットワーク(GNN)を用いた予測手法を提案する。
コードとデータセットを公開して、ロボットシミュレーションと把握の研究を進めました。
論文 参考訳(メタデータ) (2024-02-05T19:21:52Z) - Learning Flexible Body Collision Dynamics with Hierarchical Contact Mesh Transformer [19.042551780033765]
階層型メッシュ構造を用いて長距離依存を学習可能な階層型コンタクトメッシュトランス(HCMT)を提案する。
HCMTは長距離相互作用を可能にし、階層メッシュ構造はすぐに遠くの位置への衝突効果を伝播させる。
その結果,HCMTは既存の手法に比べて大幅な性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2023-12-19T05:30:08Z) - DeepSimHO: Stable Pose Estimation for Hand-Object Interaction via
Physics Simulation [81.11585774044848]
我々は、前方物理シミュレーションと後方勾配近似とニューラルネットワークを組み合わせた新しいディープラーニングパイプラインであるDeepSimHOを紹介する。
提案手法は, 評価の安定性を著しく向上し, テスト時間最適化よりも優れた効率性を実現する。
論文 参考訳(メタデータ) (2023-10-11T05:34:36Z) - gradSim: Differentiable simulation for system identification and
visuomotor control [66.37288629125996]
本稿では,微分可能マルチフィジカルシミュレーションと微分可能レンダリングを活用し,3次元監督への依存を克服するフレームワークであるgradsimを提案する。
当社の統合グラフは、状態ベースの(3D)監督に頼ることなく、挑戦的なバイスモメータ制御タスクで学習を可能にします。
論文 参考訳(メタデータ) (2021-04-06T16:32:01Z) - Tracking Partially-Occluded Deformable Objects while Enforcing Geometric
Constraints [11.247580943940916]
我々は、変形可能な物体の追跡を支援するために、高忠実度物理シミュレーションを構築した。
我々はRGBD画像と幾何運動推定に基づいてオブジェクトに焦点を当てる。
コントリビューションにより、従来の手法よりも精度の面で大きなマージンを達成できます。
論文 参考訳(メタデータ) (2020-11-01T21:13:18Z) - Scalable Differentiable Physics for Learning and Control [99.4302215142673]
微分物理学は、物理的対象や環境を含む問題を学習し、制御するための強力なアプローチである。
我々は、多数のオブジェクトとその相互作用をサポートすることができる微分可能物理学のためのスケーラブルなフレームワークを開発する。
論文 参考訳(メタデータ) (2020-07-04T19:07:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。