論文の概要: Baba in Wonderland: Online Self-Supervised Dynamics Discovery for Executable World Models
- arxiv url: http://arxiv.org/abs/2605.16725v1
- Date: Sat, 16 May 2026 00:18:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.989503
- Title: Baba in Wonderland: Online Self-Supervised Dynamics Discovery for Executable World Models
- Title(参考訳): ワンダーランドのBaba: 実行可能な世界モデルのためのオンラインセルフスーパービジョンのダイナミクスディスカバリ
- Authors: SeungWon Seo, DongHeun Han, SeongRae Noh, HyeongYeop Kang,
- Abstract要約: 本研究では,事前の誤認識下でのオンライン・実行可能世界モデル学習について検討する。
我々は、失敗候補更新を構造信号として扱うクローズドループシステムであるAliceを紹介する。
アリスはこれらの矛盾を、コンパクトでクラス階層化された保存対例を提供する仮説クラスに洗練する。
- 参考スコア(独自算出の注目度): 6.941409613662482
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Executable world models can be read, edited, executed, and reused for planning, but only if the program captures the environment's transition law rather than semantic shortcuts in its surface vocabulary. We study online executable world-model learning under prior misalignment, where an agent must induce state-dependent dynamics from interaction evidence alone, without rule descriptions, reward signals, or trustworthy lexical priors. We introduce Alice, a closed-loop system that treats failed candidate updates as structural signal: when a candidate explains a new transition but loses previously explained ones, the preservation conflict reveals dynamics that the current program had conflated. Alice refines these conflicts into hypothesis classes that both provide compact, class-stratified preservation counterexamples for update and guide frontier exploration toward transitions that are novel and underrepresented with respect to the current program. We evaluate Alice on Baba in Wonderland, a prior-misaligned variant of Baba Is You that preserves simulator dynamics while replacing semantically meaningful rule-property labels with unrelated words. Experiments show that Alice substantially improves executable world-model learning under prior misalignment, and ablations show that both class refinement and class-aware exploration contribute.
- Abstract(参考訳): 実行可能な世界モデルは、計画のために読み出し、編集し、実行し、再利用することができるが、プログラムが表層語彙のセマンティックショートカットではなく、環境の遷移則をキャプチャした場合に限られる。
エージェントはルール記述や報酬信号,あるいは信頼できる語彙前処理を使わずに,相互作用証拠のみから状態依存的ダイナミクスを誘導しなければならない。
我々は、失敗した候補更新を構造的な信号として扱うクローズドループシステムであるAliceを紹介した。
アリスはこれらの対立を、現在のプログラムに関して新しく、表現されていない遷移へのフロンティア探索をガイドするために、コンパクトでクラス階層化された保存対例を提供する仮説クラスに洗練する。
In Wonderland, Alice on Baba is You, a prior-misaligned variant of Baba Is You。
実験の結果、Aliceは事前の誤り修正の下で実行可能世界モデル学習を大幅に改善し、クラス改良とクラス認識探索の両方に寄与することが示されている。
関連論文リスト
- Plan in Sandbox, Navigate in Open Worlds: Learning Physics-Grounded Abstracted Experience for Embodied Navigation [63.11032720821731]
textitSAGEは、エージェントがフォトリアリスティックなシミュレーションではなく、物理基底のセマンティック抽象化内で学習することを可能にするフレームワークである。
textitSAGEは、A-EQA上で53.21% LLM-Match Success Rateを達成することで、プランナー支援の実施ナビゲーションを大幅に改善することを示した。
論文 参考訳(メタデータ) (2026-05-11T07:34:30Z) - Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond [209.35045331678043]
2つの軸に沿って組織された「レベルx法」の分類を導入します。
第一に、3つの能力レベルを定義している: 1段階の局所遷移演算子を学ぶL1 Predictor、それらをドメインの法則を尊重する多段階のアクション条件付きロールアウトに構成するL2 Simulator、新しいエビデンスに対して予測が失敗すると自己のモデルを自動で修正するL3 Evolver。
我々は400以上の作品を合成し、モデルに基づく強化学習、ビデオ生成、WebおよびGUIエージェント、マルチエージェント社会シミュレーション、AIによる科学的発見にまたがる100以上の代表システムを要約する。
論文 参考訳(メタデータ) (2026-04-24T17:48:47Z) - Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models [31.764922248007935]
我々は、訓練された政策の潜伏状態と計画された行動が組み合わさって、すでに行動結果を予測する十分な情報を符号化していることを示す。
DILLOは、"simulate-then-act"から"describe-then-act"にパラダイムをシフトする高速なステアリング層である。
論文 参考訳(メタデータ) (2026-03-24T12:49:25Z) - Open-World Motion Forecasting [15.508091258980143]
モーション予測は、シーン内のダイナミックエージェントの将来の軌跡を予測することを目的としており、自動運転車がシーンの進化について推論できるようにする。
既存のアプローチはクローズドワールド体制の下で動作し、固定オブジェクト分類と高品質な知覚へのアクセスを仮定する。
我々は,時間とともに新しいオブジェクトクラスを順次導入し,将来的なオブジェクトの軌跡をカメラ画像から直接推定する,オープンワールドモーション予測を導入する。
論文 参考訳(メタデータ) (2026-03-10T09:35:08Z) - Executable Ontologies in Game Development: From Algorithmic Control to Semantic World Modeling [51.56484100374058]
我々は,実行可能オントロジー(EO)が,アルゴリズム行動プログラミングからセマンティックワールドモデリングへ移行したことを論じる。
本稿では,EOが明示的なプリエンプションロジックではなく,データフロー条件によるタスク割り込みを優先的に行う方法を示す。
論文 参考訳(メタデータ) (2026-01-12T19:57:35Z) - Emergence of Linear Truth Encodings in Language Models [64.86571541830598]
大規模言語モデルは偽文と真を区別する線形部分空間を示すが、それらの出現のメカニズムは不明確である。
このような真理部分空間をエンドツーエンドに再現する,透明な一層トランスフォーマー玩具モデルを導入する。
本研究では,真理エンコーディングが実現可能な単純な設定について検討し,将来のトークンにおけるLM損失を減らすために,この区別を学習するようモデルに促す。
論文 参考訳(メタデータ) (2025-10-17T16:30:07Z) - Could the Road to Grounded, Neuro-symbolic AI be Paved with Words-as-Classifiers? [16.12935949253909]
3つのセマンティックフィールドを統一する1つの潜在的経路が、ワード・アズ・クラシファイア・モデルによって舗装されていると仮定する。
我々は、この文献をレビューし、認知科学における最近の研究にアピールして、単語・アズ・クラシファイアのモデルを動機付け、小さな実験を記述した。
論文 参考訳(メタデータ) (2025-07-08T18:44:34Z) - Attacks in Adversarial Machine Learning: A Systematic Survey from the
Life-cycle Perspective [69.25513235556635]
敵対的機械学習(英: Adversarial Machine Learning、AML)は、機械学習の逆行現象を研究する。
機械学習システムの異なる段階で発生するこの敵対現象を探求するために、いくつかのパラダイムが最近開発された。
既存の攻撃パラダイムをカバーするための統一的な数学的枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-19T02:12:21Z) - Back to the Future: Unsupervised Backprop-based Decoding for
Counterfactual and Abductive Commonsense Reasoning [79.48769764508006]
ジェネレーティブ言語モデル(LM)は、過去の文脈のみを条件にするか、狭い範囲のテキスト入力を実行するよう訓練することができる。
我々は過去と将来の両方の文脈を柔軟に組み込むことができる新しい教師なし復号アルゴリズムであるDeLoreanを提案する。
提案手法は, 帰納的テキスト生成と反事実的ストーリーリビジョンの2つの非単調推論タスクに適用可能であることを示す。
論文 参考訳(メタデータ) (2020-10-12T17:58:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。