論文の概要: EWAM: An Enhanced World Action Model for Closed-Loop Online Adaptation in Embodied Intelligence
- arxiv url: http://arxiv.org/abs/2606.12690v1
- Date: Wed, 10 Jun 2026 21:24:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.469555
- Title: EWAM: An Enhanced World Action Model for Closed-Loop Online Adaptation in Embodied Intelligence
- Title(参考訳): EWAM: 身体情報におけるクローズドループオンライン適応のための拡張ワールドアクションモデル
- Authors: Xin Zhou, Cong Miao,
- Abstract要約: EWAMは、トレーニング済みで完全に凍結されたCosmos3バックボーンネットワーク上に構築されたクローズドループオンライン適応アーキテクチャである。
その性能向上は、4つの挿入された軽量ニューラルネットワーク層からなる推論時間共振機構に起因している。
ナイーブな特徴融合とは異なり、メモリ、異常検出、修正モジュールはコスモス3前方経路に深く統合されている。
- 参考スコア(独自算出の注目度): 2.660415540961114
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we propose the Enhanced World Action Model (EWAM), a closed-loop online adaptation architecture built upon a pretrained and fully frozen Cosmos3 backbone network. Evaluated entirely under a zero-shot task protocol, EWAM is centrally focused on reducing the amount of additional deployment data required to adapt to new task layouts. Notably, no extra task-specific demonstration sets were introduced in any of the evaluations, and no fine-tuning was performed on the backbone network. Its performance gains stem entirely from an inference-time co-reasoning mechanism composed of four inserted lightweight neural layers: the Neural Experience Memory Layer located in the intermediate layers of the Diffusion Transformer (DiT) provides task-relevant execution context; the Neural Anomaly Detection Layer after the state prediction head monitors the divergence between predicted and actual states in real time; the Neural Policy Routing Layer dynamically selects direct execution, conservative replanning, or rollback recovery based on the anomaly severity; and the Neural Action Correction Layer refines the generated action chunks using execution diagnostics. Unlike naive feature fusion, the memory, anomaly detection, and correction modules are deeply integrated into the Cosmos3 forward path in a differentiable manner, with only the final routing decision being a discrete supervised one.
- Abstract(参考訳): 本稿では,事前にトレーニングされた完全に凍結されたCosmos3バックボーンネットワーク上に構築されたクローズドループオンライン適応アーキテクチャであるEnhanced World Action Model (EWAM)を提案する。
EWAMはゼロショットタスクプロトコルで完全に評価されており、新しいタスクレイアウトに適応するのに必要な追加のデプロイメントデータ量を減らすことに重点を置いている。
特に、どの評価にも追加のタスク固有のデモセットは導入されず、バックボーンネットワークでは微調整は行われなかった。
そのパフォーマンス向上は、Diffusion Transformer(DiT)の中間層に位置するNeural Experience Memory Layerがタスク関連実行コンテキストを提供する、状態予測ヘッド後のNeural Anomaly Detection Layerが予測された状態と実際の状態のばらつきをリアルタイムで監視する、Neural Policy Routing Layerが異常の重大性に基づいて直接実行、保守的なリプレーニング、ロールバックリカバリを動的に選択する、Neural Action Correction Layerが実行診断を使用して生成されたアクションチャンクを洗練する、という4つの挿入された軽量ニューラルネットワークレイヤからなる推論時共振機構に大きく依存している。
ナイーブな特徴融合とは異なり、メモリ、異常検出、修正モジュールは異なる方法でコスモス3前方経路に深く統合される。
関連論文リスト
- Monitoring Neural Training with Topology: A Footprint-Predictable Collapse Index [51.56484100374058]
我々は,MHM(Modular Morse Homology maintenance)とCI(Composite Collapse Index)を併用したオンライントポロジ対応型神経表現モニタを提案する。
コンプレックスを再構築する代わりに、スパース編集を一定のスケールで適用し、離散的なモースマッチングを維持し、高速でインクリメンタルな更新をもたらす。
論文 参考訳(メタデータ) (2026-04-28T19:21:21Z) - Visual prompting reimagined: The power of the Activation Prompts [72.85146015928626]
本稿では,入力レベルのVPの範囲を広げる,アクティベーションプロンプト(AP)の概念を導入する。
APは畳み込みニューラルネットワークと視覚変換器の正規化チューニングと密接に関連している。
畳み込みニューラルネットワークと視覚変換器の正規化チューニングとAPは密接に関連していることを示す。
論文 参考訳(メタデータ) (2026-04-07T20:28:24Z) - Self-Supervised Multi-Stage Domain Unlearning for White-Matter Lesion Segmentation [0.0]
自己教師型多段階アンラーニングに基づく教師なしドメイン適応手法を提案する。
一方、SSMSUは、病変の感度を高め、誤検出を制限することにより、未学習の利点を示した。
論文 参考訳(メタデータ) (2026-03-04T22:27:20Z) - A Graph Prompt Fine-Tuning Method for WSN Spatio-Temporal Correlation Anomaly Detection [13.649966886916658]
無線SNネットワーク(WSN)におけるマルチ時間モーダルデータの異常検出は,信頼性の高いネットワーク操作において重要な保証を提供することができる。
既存の異常検出手法では, 時間的相関特性の抽出が不十分なこと, 異常サンプルの高コスト化, 異常サンプルの不均衡が問題となっている。
本稿では,バックボーンネットワークの時間相関機能とマルチタスク自己教師型トレーニング戦略を設計する。
論文 参考訳(メタデータ) (2026-01-19T05:58:53Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Variational Density Propagation Continual Learning [0.0]
現実世界にデプロイされるディープニューラルネットワーク(DNN)は、定期的にオフ・オブ・ディストリビューション(OoD)データの対象となっている。
本稿では,ベンチマーク連続学習データセットによってモデル化されたデータ分散ドリフトに適応するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-22T21:51:39Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Non-Gradient Manifold Neural Network [79.44066256794187]
ディープニューラルネットワーク(DNN)は通常、勾配降下による最適化に数千のイテレーションを要します。
非次最適化に基づく新しい多様体ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T06:39:13Z) - Modeling from Features: a Mean-field Framework for Over-parameterized
Deep Neural Networks [54.27962244835622]
本稿では、オーバーパラメータ化ディープニューラルネットワーク(DNN)のための新しい平均場フレームワークを提案する。
このフレームワークでは、DNNは連続的な極限におけるその特徴に対する確率測度と関数によって表現される。
本稿では、標準DNNとResidual Network(Res-Net)アーキテクチャを通してフレームワークを説明する。
論文 参考訳(メタデータ) (2020-07-03T01:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。