論文の概要: Reinforcement learning for inverse structural design and rapid laser cutting of kirigami prototypes
- arxiv url: http://arxiv.org/abs/2605.08098v1
- Date: Thu, 16 Apr 2026 18:12:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.692077
- Title: Reinforcement learning for inverse structural design and rapid laser cutting of kirigami prototypes
- Title(参考訳): キリガミ試作機の逆構造設計と高速レーザー切断のための強化学習
- Authors: Milad Yazdani, Shahriar Shalileh, Dena Shahriari,
- Abstract要約: キリガミは、形状プログラミング可能なメタマテリアル構造を作るための、ますます有用な製法である。
最適輸送条件付きフローマッチングと強化学習を組み合わせた逆設計フレームワークRL-Kirigamiを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Kirigami is an increasingly useful fabrication method to produce shape-programmable metamaterial structures. However, inverse design remains difficult because deployment is nonlinear, and feasible cut layouts must satisfy discrete compatibility rules, avoid overlap, and map one target shape to valid designs. We present RL-Kirigami, an inverse design framework that combines optimal-transport conditional flow matching (OT-CFM) with reinforcement learning to generate compatible ratio fields for compact reconfigurable parallelogram quad kirigami. A marching decoder enforces global geometric compatibility, and Group Relative Policy Optimization (GRPO) aligns the generator with nondifferentiable rewards for silhouette matching, feasibility, and ratio-field regularity. Across procedurally generated target shape instances, a single sample from the pretrained OT-CFM prior reached $94.2%$ sIoU and outperformed solver baselines while reducing forward simulator evaluations from hundreds to 1. GRPO improved accuracy to $94.91%$ sIoU and, with regularity included, reduced $\mathrm{TV}(\mathbf{x})$ from 0.95 to 0.81 while maintaining $94.83%$ sIoU. Generated layouts were exported to DXF and laser-cut in $50~μ\mathrm{m}$ polymeric sheets to produce deployable prototypes in $8.0 \pm 1.0$ minutes per part. These results support a manufacturing-aware inverse design workflow for deployable kirigami metamaterials under hard geometric feasibility constraints.
- Abstract(参考訳): キリガミは、形状プログラミング可能なメタマテリアル構造を作るための、ますます有用な製法である。
しかし、配置が非線形であるため、逆設計は依然として困難であり、実現可能なカットレイアウトは、個別の互換性ルールを満たし、重複を避け、1つのターゲット形状を有効な設計にマッピングする必要がある。
RL-キリガミ(RL-Kirigami)は、最適輸送条件付きフローマッチング(OT-CFM)と強化学習を組み合わせた逆設計フレームワークであり、コンパクトな再構成可能なパラレルグラムクアッドキリガミのための整合性比場を生成する。
マーチングデコーダはグローバルな幾何学的整合性を強制し、グループ相対ポリシー最適化(GRPO)は、ジェネレータをシルエットマッチング、実現可能性、比場正則性に対して微分不可能な報酬と整合させる。
手続き的に生成されたターゲット形状のインスタンス全体では、事前訓練されたOT-CFMからのサンプルは94.2%のsIoUと、数百から1までの前方シミュレータ評価を減らしながら、優れた解法ベースラインに達した。
GRPOは精度を94.91%$ sIoUに改善し、正規性を含むと$\mathrm{TV}(\mathbf{x})$ 0.95 から 0.81 に削減し、9.83%$ sIoUを維持した。
生成したレイアウトはDXFとレーザーカットで50〜μ\mathrm{m}$のポリマーシートに輸出され、デプロイ可能なプロトタイプを1分あたり8.0 \pm 1.0$ minutesで製造した。
これらの結果は, ハードな幾何学的実現性制約の下で, キリガミメタマテリアルを展開可能な製造対応逆設計ワークフローをサポートする。
関連論文リスト
- Adaptive Sensing beyond Non-Adaptive Information Limits: End-to-End Co-Design of Geometry, Policy, and Inference [0.0]
本稿では,連続ハードウェア形状に対する単一最適化とベルマン最適適応測定ポリシーを提案する。
3つのケーススタディで、共同DPはコミュニティの自然なベースラインを大きく上回っている。
ハードウェアが一度設計されているが、そのポリシーがデバイスの寿命を延ばすあらゆるセンサーにとって、ハードウェアとポリシーの共同最適化は最小限の原則である。
論文 参考訳(メタデータ) (2026-04-28T04:02:17Z) - Versor: A Geometric Sequence Architecture [0.0954904463032233]
従来の基本非線形演算の代わりにCGA(Conformal Geometric Algebra)を使用する新しいシーケンスアーキテクチャであるVersorが導入された。
VersorはカオスN体力学、トポロジカル推論、標準マルチモーダルベンチマークで検証されている。
論文 参考訳(メタデータ) (2026-02-10T19:00:02Z) - ARO: A New Lens On Matrix Optimization For Large Models [10.624890239551359]
マトリックスベースのベンチマークは、LLMトレーニング効率を改善することへの関心が高まっている。
パフォーマンスが大幅に向上する一方で、根本的な疑問が生じる: 直交化を超えて新しいパラダイムを開発することができるか?
回転を第一級設計原理として扱う新しい行列最適化フレームワークであるtexttextAdaptive Optimization (ARO) を提案する。
論文 参考訳(メタデータ) (2026-02-09T18:51:22Z) - Exploiting Function-Family Structure in Analog Circuit Optimization [22.334314861424943]
オフザシェルフのガウス過程のサロゲートは、これらのシステミックスイッチングプリミティブと不一致の、全世界的にスムーズで定常的な優先順位を課す。
これらのプリミティブを符号化した事前学習モデルでは、回路単位のエンジニアリングを使わずに信頼性の高い最適化が可能であることを実証する。
論文 参考訳(メタデータ) (2025-11-30T03:21:13Z) - PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文 参考訳(メタデータ) (2025-09-27T03:01:48Z) - Type-Compliant Adaptation Cascades: Adapting Programmatic LM Workflows to Data [12.136710894967088]
本稿では,ワークフロー適応を学習型確率型プログラムとして再放送するフレームワークであるType-Compliant Adaptation Cascadesを紹介する。
経験的に、TACは最先端のプロンプト最適化ベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2025-08-25T17:36:21Z) - REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文 参考訳(メタデータ) (2024-04-25T17:20:45Z) - SCHEME: Scalable Channel Mixer for Vision Transformers [52.605868919281086]
ビジョントランスフォーマーは多くの計算タスクで素晴らしいパフォーマンスを達成した。
密度の高い接続は、より大きな膨張比をサポートするスパースブロック対角構造に置き換えることができることを示す。
また、トレーニング中に並列分岐として、軽量でパラメータフリーなチャネル共分散アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-12-01T08:22:34Z) - Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free
Reinforcement Learning [52.76230802067506]
漸進的強化学習における後悔を最小限に抑えるために,新しいモデルフリーアルゴリズムを提案する。
提案アルゴリズムは、2つのQ-ラーニングシーケンスの助けを借りて、初期設定された参照更新ルールを用いる。
初期の分散還元法の設計原理は、他のRL設定とは独立した関心を持つかもしれない。
論文 参考訳(メタデータ) (2021-10-09T21:13:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。