論文の概要: Accurate Open-Loop Control of a Soft Continuum Robot Through Visually Learned Latent Representations
- arxiv url: http://arxiv.org/abs/2603.19655v1
- Date: Fri, 20 Mar 2026 05:43:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.006449
- Title: Accurate Open-Loop Control of a Soft Continuum Robot Through Visually Learned Latent Representations
- Title(参考訳): 視覚学習型潜在表現によるソフト連続ロボットの高精度オープンループ制御
- Authors: Henrik Krauss, Johann Licher, Naoya Takeishi, Annika Raatz, Takehisa Yairi,
- Abstract要約: 本研究は,ビデオ学習型潜伏力学からソフト連続ロボット(SCR)のオープンループ制御に対処する。
ABCDベースのモデルは、画像空間追跡エラーを一貫して減少させる。
いくつかのアーキテクチャ選択とトレーニング設定は、オープンループ制御のパフォーマンスに寄与する。
- 参考スコア(独自算出の注目度): 4.857795247230421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work addresses open-loop control of a soft continuum robot (SCR) from video-learned latent dynamics. Visual Oscillator Networks (VONs) from previous work are used, that provide mechanistically interpretable 2D oscillator latents through an attention broadcast decoder (ABCD). Open-loop, single-shooting optimal control is performed in latent space to track image-specified waypoints without camera feedback. An interactive SCR live simulator enables design of static, dynamic, and extrapolated targets and maps them to model-specific latent waypoints. On a two-segment pneumatic SCR, Koopman, MLP, and oscillator dynamics, each with and without ABCD, are evaluated on setpoint and dynamic trajectories. ABCD-based models consistently reduce image-space tracking error. The VON and ABCD-based Koopman models attains the lowest MSEs. Using an ablation study, we demonstrate that several architecture choices and training settings contribute to the open-loop control performance. Simulation stress tests further confirm static holding, stable extrapolated equilibria, and plausible relaxation to the rest state. To the best of our knowledge, this is the first demonstration that interpretable, video-learned latent dynamics enable reliable long-horizon open-loop control of an SCR.
- Abstract(参考訳): 本研究は,ビデオ学習型潜伏力学からソフト連続ロボット(SCR)のオープンループ制御に対処する。
従来の作業の視覚オシレータネットワーク(VON)は、アテンションブロードキャストデコーダ(ABCD)を介して機械的に解釈可能な2D発振器ラテントを提供する。
カメラのフィードバックを伴わずに画像特定経路を追尾するために,ループのオープン・シングルシューティング最適制御が潜時空間で実施される。
インタラクティブなSCRライブシミュレータは、静的、動的、外挿されたターゲットの設計を可能にし、それらをモデル固有の潜在経路ポイントにマップする。
2段空気圧SCRでは, ABCDを伴わない2段空気圧SCR, Koopman, MLP, および発振器ダイナミクスを, セットポイントおよび動的軌道上で評価した。
ABCDベースのモデルは、画像空間追跡エラーを一貫して減少させる。
VONとABCDをベースとしたKoopmanモデルは最低のMSEを達成している。
アブレーション研究を用いて、いくつかのアーキテクチャ選択とトレーニング設定がオープンループ制御性能に寄与することを実証した。
シミュレーション応力試験により、静的保持、安定な外挿平衡、静止状態への可塑性緩和がさらに確認された。
我々の知る限りでは、これは、ビデオ学習された遅延力学がSCRの信頼性の高い長距離オープンループ制御を可能にする最初の実証である。
関連論文リスト
- From Frames to Sequences: Temporally Consistent Human-Centric Dense Prediction [22.291273919939957]
我々は、人間のフレームと、画素精度の深度、正常度、マスクを用いた動き整列を生成するスケーラブルな合成データパイプラインを開発した。
我々は、CSE埋め込みを介して、明示的な幾何学的人体を注入する統合されたViTベースの密度予測器を訓練する。
静的プレトレーニングと動的シーケンス監視を組み合わせた2段階のトレーニング戦略により、まず、ロバストな空間表現を取得し、その後、動きに沿ったシーケンス間で時間的一貫性を洗練できる。
論文 参考訳(メタデータ) (2026-02-02T05:28:58Z) - DRAW2ACT: Turning Depth-Encoded Trajectories into Robotic Demonstration Videos [24.681248200255975]
ビデオモデルは、組み込みAIのための強力な現実世界シミュレータを提供するが、ロボット操作の制御性には制限がある。
入力軌跡から複数の表現を抽出するトラジェクトリ条件付きビデオ生成フレームワークであるDRAW2ACTを提案する。
DRAW2ACTは、既存のベースラインよりも高い操作成功率を示しながら、より優れた視覚的忠実度と一貫性を実現する。
論文 参考訳(メタデータ) (2025-12-16T09:11:36Z) - Learning Visually Interpretable Oscillator Networks for Soft Continuum Robots from Video [4.857795247230421]
本稿では,自動エンコーダに基づく潜在動的学習のためのプラグイン・アンド・プレイモジュールであるAttention Broadcast Decoder (ABCD)を紹介する。
ABCDは静的背景をフィルタリングしながら、各潜伏次元の寄与をローカライズした画素精度の注意マップを生成する。
ABCDに基づくモデルにより,複数ステップの予測精度が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2025-11-23T07:27:39Z) - RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.03973683867797]
本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。
提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T13:01:16Z) - KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。