論文の概要: Multiscale Sensor Fusion and Continuous Control with Neural CDEs
- arxiv url: http://arxiv.org/abs/2203.08715v1
- Date: Wed, 16 Mar 2022 16:06:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-17 14:13:11.786463
- Title: Multiscale Sensor Fusion and Continuous Control with Neural CDEs
- Title(参考訳): ニューラルcdesを用いたマルチスケールセンサ融合と連続制御
- Authors: Sumeet Singh, Francis McCann Ramirez, Jacob Varley, Andy Zeng, Vikas
Sindhwani
- Abstract要約: InFuserは,ニューラル制御方程式差分(CDE)を用いて連続的な時間政治を訓練する統一アーキテクチャである。
InFuserは、(In)tegratingと(Fus)ing multi-sensory Observationによって、時間とともに単一の潜伏状態表現を進化させる。
実験では、InFuserは動的タスクの堅牢なポリシーを学ぶ。
- 参考スコア(独自算出の注目度): 17.67182664077201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Though robot learning is often formulated in terms of discrete-time Markov
decision processes (MDPs), physical robots require near-continuous multiscale
feedback control. Machines operate on multiple asynchronous sensing modalities,
each with different frequencies, e.g., video frames at 30Hz, proprioceptive
state at 100Hz, force-torque data at 500Hz, etc. While the classic approach is
to batch observations into fixed-time windows then pass them through
feed-forward encoders (e.g., with deep networks), we show that there exists a
more elegant approach -- one that treats policy learning as modeling latent
state dynamics in continuous-time. Specifically, we present 'InFuser', a
unified architecture that trains continuous time-policies with Neural
Controlled Differential Equations (CDEs). InFuser evolves a single latent state
representation over time by (In)tegrating and (Fus)ing multi-sensory
observations (arriving at different frequencies), and inferring actions in
continuous-time. This enables policies that can react to multi-frequency multi
sensory feedback for truly end-to-end visuomotor control, without discrete-time
assumptions. Behavior cloning experiments demonstrate that InFuser learns
robust policies for dynamic tasks (e.g., swinging a ball into a cup) notably
outperforming several baselines in settings where observations from one sensing
modality can arrive at much sparser intervals than others.
- Abstract(参考訳): ロボット学習は離散時間マルコフ決定過程(MDP)の用語で定式化されることが多いが、物理的ロボットは、ほぼ連続したマルチスケールフィードバック制御を必要とする。
マシンは、例えば30Hzの動画フレーム、100Hzの固有受容状態、500Hzのフォーストルクデータなど、異なる周波数の複数の非同期センシングモードで動作する。
古典的なアプローチは、固定時間ウィンドウに観察をバッチし、フィードフォワードエンコーダ(例えばディープネットワーク)に渡すことであるが、よりエレガントなアプローチが存在することを示している。
具体的には、ニューラル制御微分方程式(CDE)を用いて連続的な時間政治を訓練する統一アーキテクチャ「InFuser」を提案する。
InFuser は (In) tegrating と (Fus)ing multi-sensory observed (Ariving at different frequency), and inferring action in continuous-time によって、時間とともに単一の潜在状態表現を進化させる。
これにより、離散時間仮定なしでマルチ周波数マルチセンサフィードバックに反応し、真のエンドツーエンドのビズモータ制御を可能にする。
行動クローニング実験は、InFuserが動的タスク(例えば、カップにボールを振りかけるなど)のロバストなポリシーを学習していることを示し、特に、ある知覚的モダリティからの観察が他のものよりもはるかに狭い間隔で到達できるような設定において、いくつかのベースラインを上回っている。
関連論文リスト
- MPSDynamics.jl: Tensor network simulations for finite-temperature (non-Markovian) open quantum system dynamics [0.0]
MPSDynamics.jlパッケージは、ゼロ温度と有限温度でオープン量子システムシミュレーションを実行するための使いやすいインターフェースを提供する。
Juliaプログラミング言語で書かれたMPSDynamics.jlは汎用的なオープンソースパッケージである。
論文 参考訳(メタデータ) (2024-06-11T08:34:59Z) - Multistep Inverse Is Not All You Need [87.62730694973696]
実世界の制御環境では、観測空間は不要に高次元であり、時間関連ノイズにさらされることが多い。
したがって、観測空間を制御関連変数のより単純な空間にマッピングするエンコーダを学ぶことが望ましい。
本稿では,多段階逆予測と遅延フォワードモデルを組み合わせた新しいアルゴリズムACDFを提案する。
論文 参考訳(メタデータ) (2024-03-18T16:36:01Z) - Motion Code: Robust Time Series Classification and Forecasting via Sparse Variational Multi-Stochastic Processes Learning [3.2857981869020327]
本稿では,各時系列を連続的なプロセスの実現とみなす新しいフレームワークを提案する。
この数学的アプローチは、タイムスタンプ間の依存関係をキャプチャし、ノイズ内の隠れた時間変化信号を検出する。
現実のパーキンソン病センサートラッキングを含むノイズの多いデータセットの実験は、確立されたベンチマークに対するモーションコードの強力なパフォーマンスを実証している。
論文 参考訳(メタデータ) (2024-02-21T19:10:08Z) - Graph-Aware Contrasting for Multivariate Time-Series Classification [50.84488941336865]
既存のコントラスト学習手法は主に、時間的拡張とコントラスト技術による時間的一貫性を達成することに焦点を当てている。
MTSデータ間の空間的整合性を考慮したグラフ認識コントラストを提案する。
提案手法は,様々なMSS分類タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-11T02:35:22Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Robust Audio Anomaly Detection [10.75127981612396]
提案されたアプローチは、トレーニングデータセットにラベル付き異常が存在することを前提としません。
時間力学は、注意機構を付加した繰り返し層を用いてモデル化される。
ネットワークの出力は、外向きの頑健な確率密度関数である。
論文 参考訳(メタデータ) (2022-02-03T17:19:42Z) - Value Iteration in Continuous Actions, States and Time [99.00362538261972]
連続状態と動作に対する連続的適合値反復(cFVI)アルゴリズムを提案する。
非線形制御アフィンダイナミクスに対して最適なポリシを導出することができる。
物理システムのビデオは、urlhttps://sites.google.com/view/value-iteration.comで入手できる。
論文 参考訳(メタデータ) (2021-05-10T21:40:56Z) - Behavioral Model Inference of Black-box Software using Deep Neural
Networks [1.6593369275241105]
テストや異常検出といった多くのソフトウェアエンジニアリングタスクは、ソフトウェアの振る舞いモデルを予測する能力の恩恵を受けることができる。
既存の推論アプローチのほとんどは、実行シーケンスを収集するコードへのアクセスを前提としている。
本稿では,この手法を用いて状態変化を正確に検出する方法と,推定されたモデルがトランスフォーメーション学習シナリオにどのように適用できるかを示す。
論文 参考訳(メタデータ) (2021-01-13T09:23:37Z) - Motion Prediction Using Temporal Inception Module [96.76721173517895]
人間の動作を符号化するTIM(Temporal Inception Module)を提案する。
本フレームワークは,異なる入力長に対して異なるカーネルサイズを用いて,畳み込み層を用いて入力埋め込みを生成する。
標準的な動き予測ベンチマークデータセットであるHuman3.6MとCMUのモーションキャプチャデータセットの実験結果から,我々の手法は一貫して技術手法の状態を上回ります。
論文 参考訳(メタデータ) (2020-10-06T20:26:01Z) - Learning Continuous-Time Dynamics by Stochastic Differential Networks [32.63114111531396]
変動微分ネットワーク(VSDN)という,フレキシブルな連続時間リカレントニューラルネットワークを提案する。
VSDNは神経微分方程式(SDE)による散発時間系列の複雑なダイナミクスを埋め込む
VSDNは最先端の継続的ディープラーニングモデルより優れており、散発時系列の予測やタスクにおいて優れた性能を発揮する。
論文 参考訳(メタデータ) (2020-06-11T01:40:34Z) - Liquid Time-constant Networks [117.57116214802504]
本稿では,時間連続リカレントニューラルネットワークモデルについて紹介する。
暗黙の非線形性によって学習システムの力学を宣言する代わりに、線形一階力学系のネットワークを構築する。
これらのニューラルネットワークは安定かつ有界な振る舞いを示し、ニューラル常微分方程式の族の中で優れた表現性をもたらす。
論文 参考訳(メタデータ) (2020-06-08T09:53:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。