論文の概要: Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow
- arxiv url: http://arxiv.org/abs/2603.05448v1
- Date: Thu, 05 Mar 2026 18:20:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.363009
- Title: Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow
- Title(参考訳): 時変流下でのロバストなマイクロロボティックセルの残留RL--MPC
- Authors: Yanda Yang, Sambeeta Das,
- Abstract要約: 微小流体流中における接触豊富なマイクロマニピュレーションは、小さな乱れが接触を壊し、大きな横方向のドリフトを引き起こすため、困難である。
時間変化したポアゼイユ流下でのウェイポイントサンプリングされた基準曲線を追尾する磁気マイクロロボットによる平面セルの押圧について検討した。
SACが学習した残留ポリシーで名目MPCを増強するハイブリッドコントローラを提案する。
- 参考スコア(独自算出の注目度): 0.6053202932413693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contact-rich micromanipulation in microfluidic flow is challenging because small disturbances can break pushing contact and induce large lateral drift. We study planar cell pushing with a magnetic rolling microrobot that tracks a waypoint-sampled reference curve under time-varying Poiseuille flow. We propose a hybrid controller that augments a nominal MPC with a learned residual policy trained by SAC. The policy outputs a bounded 2D velocity correction that is contact-gated, so residual actions are applied only during robot--cell contact, preserving reliable approach behavior and stabilizing learning. All methods share the same actuation interface and speed envelope for fair comparisons. Experiments show improved robustness and tracking accuracy over pure MPC and PID under nonstationary flow, with generalization from a clover training curve to unseen circle and square trajectories. A residual-bound sweep identifies an intermediate correction limit as the best trade-off, which we use in all benchmarks.
- Abstract(参考訳): 微小流体流中における接触豊富なマイクロマニピュレーションは、小さな乱れが接触を壊し、大きな横方向のドリフトを引き起こすため、困難である。
時間変化したポアゼイユ流下でのウェイポイントサンプリングされた基準曲線を追尾する磁気マイクロロボットによる平面セルの押圧について検討した。
SACが学習した残留ポリシーで名目MPCを増強するハイブリッドコントローラを提案する。
このポリシーは、接触ゲートされた境界2次元速度補正を出力するので、残留動作は、ロボット-セル接触時にのみ適用され、信頼性の高いアプローチ行動を保持し、学習を安定化する。
すべてのメソッドは、公正な比較のために同じアクチュエータインタフェースと速度エンベロープを共有している。
非定常流下でのMPCおよびPIDのロバスト性および追跡精度は, クローバートレーニング曲線から円と正方形軌道への一般化により向上した。
残留バウンド・スイープは、すべてのベンチマークで使用した最良のトレードオフとして中間修正限界を識別する。
関連論文リスト
- FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - PRISM: Performer RS-IMLE for Single-pass Multisensory Imitation Learning [51.24484551729328]
PRISMは,IMLEのバッチ・グロバル・リジェクション・サンプリングに基づく単一パスポリシーである。
PRISMは、Performerアーキテクチャを用いた線形アテンション発生器と時間的マルチセンサエンコーダを結合する。
7-DoFアームD1を搭載したUnitree Go2を用いたロコマニピュレーションやUR5マニピュレータを用いたテーブルトップ操作など,PRISMの有効性を実証する。
論文 参考訳(メタデータ) (2026-02-02T17:57:37Z) - Polychronous Wave Computing: Timing-Native Address Selection in Spiking Networks [0.0]
Polychronous Wave Computingは、タイミングネイティブなアドレス選択プリミティブである。
スパイク時間は回転フレームに位相符号化され、プログラム可能なマルチポート干渉計で処理される。
位相ラップと相互コヒーレンスによって課される操作封筒を導出する。
論文 参考訳(メタデータ) (2026-01-19T14:12:01Z) - DeFloMat: Detection with Flow Matching for Stable and Efficient Generative Object Localization [0.5872014229110213]
DeFloMatは、新しい生成オブジェクト検出フレームワークである。
拡散型検出器の臨界遅延ボトルネックに対処する。
DeFloMatは、わずか3ドルの推論ステップで最先端の精度(43.32%テキストAP_10:50$)を達成する。
論文 参考訳(メタデータ) (2025-12-26T23:07:40Z) - Renaissance of RNNs in Streaming Clinical Time Series: Compact Recurrence Remains Competitive with Transformers [7.2223905625339455]
我々は,MIT-BIH Arrhythmia Database上で,1秒あたりの心拍数を用いて,医療時系列をストリーミングするための,コンパクトで厳密な因果性ベンチマークを示す。
2つのタスクは、長期の頻拍リスク(次の10秒)と1ステップの心拍数予測という、レコードレベルの非重複分割の下で研究される。
論文 参考訳(メタデータ) (2025-10-19T00:45:47Z) - Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。
SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。
この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文 参考訳(メタデータ) (2025-10-17T07:43:51Z) - Align Your Tangent: Training Better Consistency Models via Manifold-Aligned Tangents [55.43139356528315]
一貫性モデル(CM)は、フロー常微分方程式の軌跡に一貫性があるように訓練される。
CMは典型的には、競争力のあるサンプルの品質を得るために、大きなバッチサイズで長期のトレーニングを必要とする。
本稿では,データ多様体に向いた多様体整列接点を提供する,MFDと呼ばれる新しい損失関数を提案する。
論文 参考訳(メタデータ) (2025-10-01T08:35:18Z) - SAC Flow: Sample-Efficient Reinforcement Learning of Flow-Based Policies via Velocity-Reparameterized Sequential Modeling [9.936731043466699]
多段階アクションサンプリングプロセスの勾配が原因で,非政治強化学習による表現型フローベース政策の訓練が不安定であることが知られている。
フローロールアウトはリカレント計算に代数的に等価であり、RNNと同様の消滅や爆発的な勾配に影響を受けやすい。
我々は,これらのポリシーのエンドツーエンドのトレーニングを容易にする,ノイズ強化ロールアウトによって実現された実用的なSACベースのアルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-09-30T04:21:20Z) - RMS: Redundancy-Minimizing Point Cloud Sampling for Real-Time Pose Estimation [13.163076804805732]
本稿では,3次元点群内の冗長性を最小化する RMS という新しい点群サンプリング手法を提案する。
RMSをポイントベースKISS-ICPと機能ベースLOAMオドメトリーパイプラインに統合する。
実験により、RMSは高度で幾何学的に生成された設定において、最先端の手法よりも高速、圧縮、精度が優れていることが示された。
論文 参考訳(メタデータ) (2023-12-12T14:55:49Z) - Revisiting Rotation Averaging: Uncertainties and Robust Losses [51.64986160468128]
現在の手法の主な問題は、推定エピポーラを通して入力データと弱い結合しか持たない最小コスト関数である。
本稿では,点対応から回転平均化への不確実性を直接伝播させることにより,基礎となる雑音分布をモデル化することを提案する。
論文 参考訳(メタデータ) (2023-03-09T11:51:20Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。