論文の概要: Latent Space Reinforcement Learning for Inverse Material Estimation in Food Fracture Simulation
- arxiv url: http://arxiv.org/abs/2606.16870v1
- Date: Mon, 15 Jun 2026 15:47:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.680099
- Title: Latent Space Reinforcement Learning for Inverse Material Estimation in Food Fracture Simulation
- Title(参考訳): 食品破壊シミュレーションにおける逆材料推定のための潜時空間強化学習
- Authors: Adrian Ramlal, Yuhao Chen, John S. Zelek,
- Abstract要約: 本研究では,非微分不能損傷力学シミュレータにおける破壊挙動の目標記述から材料パラメータを推定する逆問題に対処する。
テストケースとしてオレンジピーリングを用い,2000の前方シミュレーションで神経サロゲートを訓練し,CMA-ESとPPOポリシを比較した。
共有サロゲートを持つ正規化フロー潜在空間で動作することにより、目標条件付きポリシーはシミュレータを通して検証された場合、0.642の実際のリカバリを達成する。
- 参考スコア(独自算出の注目度): 15.245617734787958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Realistic visual simulation of food manipulation requires accurate material parameters, yet these are difficult to measure directly and vary across the heterogeneous regions of a single food item. We address the inverse problem of estimating material parameters from a target description of fracture behavior in a non-differentiable continuum damage mechanics simulator. Using orange peeling as a test case, we train a neural surrogate on 2,000 forward simulations and compare Covariance Matrix Adaptation Evolution Strategy (CMA-ES, a gradient-free evolutionary optimizer) with Proximal Policy Optimization (PPO, a reinforcement learning algorithm) across the original 9-dimensional parameter space and two learned 4-dimensional latent representations. Since different oranges have different material properties, a practical inverse system must handle arbitrary targets without retraining. We train a goal-conditioned PPO policy that learns a general inverse mapping: given any target description of peeling behavior, the policy produces a material parameter estimate in a single forward pass (8 surrogate evaluations, approximately 10ms). Operating in a normalizing flow latent space with a shared surrogate evaluator, the goal-conditioned policy achieves 0.642 actual recovery when validated through the simulator, outperforming the original parameter space by 23%. A warm-start extension that initializes CMA-ES refinement from the policy's output further improves recovery to 0.828 with 540 evaluations. These findings provide a practical framework for inverse food physics and lay groundwork for vision-driven material identification from video observations of food manipulation.
- Abstract(参考訳): 食品操作の現実的な視覚シミュレーションには正確な材料パラメータが必要であるが、これらは直接測定することは困難であり、1つの食品の異種領域で異なる。
非微分連続体損傷力学シミュレータにおける破壊挙動の目標記述から材料パラメータを推定する逆問題に対処する。
オレンジピーリングをテストケースとして、2000の前方シミュレーションでニューラルサロゲートをトレーニングし、CMA-ES(勾配のない進化最適化手法)とPPO(強化学習アルゴリズム)を元の9次元パラメータ空間と2つの学習された4次元潜在表現と比較する。
異なるオレンジは異なる材料特性を持つため、現実的な逆システムは再訓練することなく任意のターゲットを扱わなければならない。
我々は、一般的な逆写像を学習する目標条件付きPPOポリシーを訓練する: 剥離行動の目標記述が与えられた場合、このポリシーは単一の前方通過(約8サロゲート評価、約10ms)で物質パラメータ推定を生成する。
共有代理評価器を用いて正規化フロー潜在空間で動作し、シミュレータを通して検証した場合、ゴール条件付きポリシーは0.642の実際のリカバリを達成し、元のパラメータ空間を23%上回る。
CMA-ESの改良を政策の出力から初期化するウォームスタート拡張は、さらに540の評価で0.828に改善する。
これらの知見は、逆食品物理学の実践的な枠組みと、食品操作のビデオ観察から視覚駆動型物質識別の土台となる。
関連論文リスト
- Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Bridging Simulation and Reality: Cross-Domain Transfer with Semantic 2D Gaussian Splatting [60.513168855890974]
ロボット操作におけるクロスドメイン転送は、シミュレートされた環境と実世界の環境の間に大きなドメインギャップがあるため、長年にわたる課題である。
本研究では,オブジェクト中心の領域不変空間特徴を抽出する新しい表現法であるSemantic 2D Gaussian Splatting (S2GS)を提案する。
S2GSはsim-to-real転送性を大幅に改善し、現実世界のシナリオで高安定なタスク性能を維持する。
論文 参考訳(メタデータ) (2025-12-04T12:16:15Z) - Opening the Sim-to-Real Door for Humanoid Pixel-to-Action Policy Transfer [59.02729900344616]
GPUを加速したフォトリアリスティックなシミュレーションは、ロボット学習のためのスケーラブルなデータ生成パスを開いた。
視覚に基づくヒューマノイドロコ操作のための教師-学生-ブートストラップ学習フレームワークを開発した。
これは、純粋なRGB知覚を用いた多様な調音ロコ操作が可能な初めてのヒューマノイド・シム・トゥ・リアル政策である。
論文 参考訳(メタデータ) (2025-11-30T20:07:13Z) - Parameter-Efficient Conditioning for Material Generalization in Graph-Based Simulators [2.504298819189614]
グラフネットワークベースのシミュレータ(GNS)は、粒子ベースの物理学を学ぶ強力な可能性を示している。
既存のモデルは通常、単一の素材タイプのために訓練され、異なる振る舞いを一般化することができない。
本稿では,GNSモデルを材料パラメータに適応させるパラメータ効率条件付け機構を提案する。
論文 参考訳(メタデータ) (2025-11-07T17:55:35Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Post Reinforcement Learning Inference [20.521169740409263]
強化学習アルゴリズムによって収集されたデータを用いて推定と推定を行う。
この分散を安定化させるために適応重みを用いる重み付き一般化モーメント法(GMM)を提案する。
主な用途は、動的処理効果の推定と動的オフポリシー評価である。
論文 参考訳(メタデータ) (2023-02-17T12:53:15Z) - Flow based features and validation metric for machine learning
reconstruction of PIV data [0.0]
物理指向アプローチによる実データからのフローフィールドの再構築は、AIコミュニティにおける流体科学者の現在の課題である。
本稿では、異なるフローベースの特徴のコントリビューションを研究するために機械学習アプローチを適用する。
物理フロー再生の重要な要件として, 質量保存則を反映した計量法則を提案する。
論文 参考訳(メタデータ) (2021-05-27T20:05:41Z) - Appearance Learning for Image-based Motion Estimation in Tomography [60.980769164955454]
トモグラフィー画像では、取得した信号に擬似逆フォワードモデルを適用することにより、解剖学的構造を再構成する。
患者の動きは、復元過程における幾何学的アライメントを損なうため、運動アーティファクトが生じる。
本研究では,スキャン対象から独立して剛性運動の構造を認識する外観学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-18T09:49:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。