論文の概要: Learn2Fold: Structured Origami Generation with World Model Planning
- arxiv url: http://arxiv.org/abs/2603.29585v1
- Date: Mon, 02 Feb 2026 11:24:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:13.142721
- Title: Learn2Fold: Structured Origami Generation with World Model Planning
- Title(参考訳): Learn2Fold:世界モデルプランニングによる構造化折り紙生成
- Authors: Yanjia Huang, Yunuo Chen, Ying Jiang, Jinru Han, Zhengzhong Tu, Yin Yang, Chenfanfu Jiang,
- Abstract要約: 折り紙は 厳密な幾何学的公理と 強硬なキネマティックな制約で 支配されている。
単一の無効な切断または衝突は、すべての折り畳みシーケンスを無効にすることができる。
本稿では,折り紙折り畳みをクレーゼパターングラフ上での条件付きプログラム誘導として定式化するニューラルシンボリックフレームワークであるLearner2Foldを紹介する。
- 参考スコア(独自算出の注目度): 32.69934044200432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability to transform a flat sheet into a complex three-dimensional structure is a fundamental test of physical intelligence. Unlike cloth manipulation, origami is governed by strict geometric axioms and hard kinematic constraints, where a single invalid crease or collision can invalidate the entire folding sequence. As a result, origami demands long-horizon constructive reasoning that jointly satisfies precise physical laws and high-level semantic intent. Existing approaches fall into two disjoint paradigms: optimization-based methods enforce physical validity but require dense, precisely specified inputs, making them unsuitable for sparse natural language descriptions, while generative foundation models excel at semantic and perceptual synthesis yet fail to produce long-horizon, physics-consistent folding processes. Consequently, generating valid origami folding sequences directly from text remains an open challenge. To address this gap, we introduce Learn2Fold, a neuro-symbolic framework that formulates origami folding as conditional program induction over a crease-pattern graph. Our key insight is to decouple semantic proposal from physical verification. A large language model generates candidate folding programs from abstract text prompts, while a learned graph-structured world model serves as a differentiable surrogate simulator that predicts physical feasibility and failure modes before execution. Integrated within a lookahead planning loop, Learn2Fold enables robust generation of physically valid folding sequences for complex and out-of-distribution patterns, demonstrating that effective spatial intelligence arises from the synergy between symbolic reasoning and grounded physical simulation.
- Abstract(参考訳): 平らなシートを複雑な3次元構造に変換する能力は、物理的な知性の基本的なテストである。
布の操作とは異なり、折り紙は厳密な幾何学的公理と硬い運動的制約によって管理され、単一の無効なクレーゼや衝突が折り畳みシーケンス全体を無効にすることができる。
その結果、折り紙は厳密な物理法則と高レベルの意味的意図を兼ね備えた長い水平的構成的推論を要求された。
最適化に基づく手法は物理的妥当性を強制するが、厳密で正確に定義された入力を必要とするため、簡潔な自然言語記述には適さない。
したがって、テキストから直接有効な折り紙の折り畳みシーケンスを生成することは、未解決の課題である。
このギャップに対処するために、クレーゼパターングラフ上での条件付きプログラム誘導として折り紙の折り畳みを定式化するニューラルシンボリックフレームワークであるLearner2Foldを紹介した。
私たちのキーとなる洞察は、セマンティックな提案を物理的な検証から切り離すことです。
大きな言語モデルは抽象テキストプロンプトから候補の折り畳みプログラムを生成し、学習されたグラフ構造化世界モデルは、実行前に物理的実現可能性と障害モードを予測する、微分可能なサロゲートシミュレータとして機能する。
ルックアヘッド計画ループに統合されたLearner2Foldは、複雑な分布パターンと分布パターンの物理的に有効な折りたたみ配列を堅牢に生成し、シンボル推論と接地された物理シミュレーションの相乗効果から効果的な空間知能が生じることを示す。
関連論文リスト
- OrigamiBench: An Interactive Environment to Synthesize Flat-Foldable Origamis [28.493060188882314]
物理的な世界で計画し、行動し、創造できるAIシステムを構築するには、パターン認識以上のものが必要です。
このようなシステムは、シーケンシャルな決定を導くために、物理的プロセスを管理する因果的メカニズムや制約を理解する必要がある。
この能力は、内部言語モデルに類似した内部表現に依存しており、観察、行動、その結果の環境変化を関連づけている。
モデルが折り畳みを反復的に提案し,対象設定と物理的妥当性および類似性に関するフィードバックを受け取る,インタラクティブなベンチマークであるOrigamiBenchを紹介する。
論文 参考訳(メタデータ) (2026-03-14T09:33:29Z) - Multi-Agent Procedural Graph Extraction with Structural and Logical Refinement [66.51979814832332]
モデル式は、専用の構造的および論理的洗練を伴う多ラウンド推論プロセスとして手続きグラフ抽出を定式化する。
実験により、モデルが強いベースラインに対して構造的正当性と論理的整合性の両方において大幅に改善されることが示されている。
論文 参考訳(メタデータ) (2026-01-27T04:00:48Z) - Kinematify: Open-Vocabulary Synthesis of High-DoF Articulated Objects [59.51185639557874]
本稿では,任意のRGB画像やテキスト記述から直接音声オブジェクトを合成するフレームワークであるKinematifyを紹介する。
提案手法は, 高DoFオブジェクトに対する運動的トポロジの推測と静的幾何からの関節パラメータの推定という2つの課題に対処する。
論文 参考訳(メタデータ) (2025-11-03T07:21:42Z) - Physics-Informed Neural Networks for Programmable Origami Metamaterials with Controlled Deployment [0.0]
本稿では, 物理インフォームドニューラルネットワーク(PINN)を用いて, 折り紙の前方予測と逆設計を行う。
このモデルは、非物理的アーティファクトを最小限にしながら、高精度で完全なエネルギー景観を予測する。
この研究は、折り紙にインスパイアされたメタマテリアルにおける複雑な機械的エネルギー景観をプログラミングするための汎用的でデータフリーなルートを確立する。
論文 参考訳(メタデータ) (2025-08-19T06:38:49Z) - In-situ graph reasoning and knowledge expansion using Graph-PReFLexOR [0.0]
グラフ推論とシンボリック抽象化を組み合わせてドメイン知識を動的に拡張するフレームワークであるGraph-PReFLexORを提案する。
強化学習に触発されて、推論は構造化されたマッピングとして定義され、タスクが知識グラフ、抽象パターン、そして最終的には最終回答を生み出す。
その結果、より優れた推論深度と適応性を示し、透明で多分野のAI駆動型発見の可能性を示している。
論文 参考訳(メタデータ) (2025-01-14T13:52:41Z) - Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.68385617116854]
トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部の動作や推論メカニズムを理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがCFG定義階層を正確に学習し、推論し、それに基づいて文を生成することを実証する。
論文 参考訳(メタデータ) (2023-05-23T04:28:16Z) - MetaLogic: Logical Reasoning Explanations with Fine-Grained Structure [129.8481568648651]
複雑な実生活シナリオにおけるモデルの論理的推論能力を調べるためのベンチマークを提案する。
推論のマルチホップ連鎖に基づいて、説明形式は3つの主成分を含む。
この新たな説明形式を用いて,現在のベストモデルの性能を評価した。
論文 参考訳(メタデータ) (2022-10-22T16:01:13Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Modelling Compositionality and Structure Dependence in Natural Language [0.12183405753834563]
言語学と集合論に基づいて、これらの概念の形式化がこの論文の前半で述べられている。
言語処理を行う認知システムは,特定の機能的制約を持つ必要がある。
単語埋め込み技術の進歩を利用して、関係学習のモデルがシミュレートされる。
論文 参考訳(メタデータ) (2020-11-22T17:28:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。