論文の概要: Deep Learning Method for Cell-Wise Object Tracking, Velocity Estimation
and Projection of Sensor Data over Time
- arxiv url: http://arxiv.org/abs/2306.06126v2
- Date: Sun, 18 Jun 2023 19:17:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 01:02:43.866299
- Title: Deep Learning Method for Cell-Wise Object Tracking, Velocity Estimation
and Projection of Sensor Data over Time
- Title(参考訳): セルワイズ物体追跡、速度推定、時間経過によるセンサデータの投影のための深層学習法
- Authors: Marco Braun, Moritz Luszek, Mirko Meuter, Dominic Spata, Kevin Kollek
and Anton Kummert
- Abstract要約: 我々は、ConvNetがこのタスクのアーキテクチャ上の制約にどのように悩まされているかを示す。
最後のステップでは、抽出した速度推定に基づいて、リカレントニューラルネットワークのメモリ状態を投影する。
- 参考スコア(独自算出の注目度): 0.7340017786387767
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Current Deep Learning methods for environment segmentation and velocity
estimation rely on Convolutional Recurrent Neural Networks to exploit
spatio-temporal relationships within obtained sensor data. These approaches
derive scene dynamics implicitly by correlating novel input and memorized data
utilizing ConvNets. We show how ConvNets suffer from architectural restrictions
for this task. Based on these findings, we then provide solutions to various
issues on exploiting spatio-temporal correlations in a sequence of sensor
recordings by presenting a novel Recurrent Neural Network unit utilizing
Transformer mechanisms. Within this unit, object encodings are tracked across
consecutive frames by correlating key-query pairs derived from sensor inputs
and memory states, respectively. We then use resulting tracking patterns to
obtain scene dynamics and regress velocities. In a last step, the memory state
of the Recurrent Neural Network is projected based on extracted velocity
estimates to resolve aforementioned spatio-temporal misalignment.
- Abstract(参考訳): 環境セグメンテーションと速度推定のための最近のディープラーニング手法は、得られたセンサデータ内の時空間関係を利用する畳み込みリカレントニューラルネットワークに依存している。
これらのアプローチは、ConvNetsを利用した新しい入力と記憶データの関連付けにより、シーンダイナミクスを暗黙的に導き出す。
我々は、convnetがこのタスクのアーキテクチャ上の制約に苦しむ様子を示す。
そこで本研究では,トランスフォーマー機構を応用した新しいリカレントニューラルネットワークユニットを提示することにより,センサ記録の時系列における時空間相関の活用に関する様々な課題を解決する。
このユニット内のオブジェクトエンコーディングは、それぞれセンサ入力とメモリ状態から派生したキー-クエリペアを関連付け、連続したフレーム間で追跡される。
次に、結果の追跡パターンを使用して、シーンダイナミクスと回帰速度を得る。
最後のステップでは、抽出された速度推定に基づいてリカレントニューラルネットワークのメモリ状態を投影し、上記の時空間的不一致を解決する。
関連論文リスト
- TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Leveraging arbitrary mobile sensor trajectories with shallow recurrent
decoder networks for full-state reconstruction [4.243926243206826]
LSTM(long, short-term memory)ネットワークやデコーダネットワークのようなシーケンス・ツー・ベクター・モデルでは,動的情報を全状態空間推定にマッピング可能であることを示す。
ネットワークアーキテクチャの例外的な性能は、3つのアプリケーションで実証される。
論文 参考訳(メタデータ) (2023-07-20T21:42:01Z) - Neural Operator Learning for Long-Time Integration in Dynamical Systems with Recurrent Neural Networks [1.6874375111244329]
深層ニューラルネットワークは、推論中に計算コストを削減し、観測データから直接トレーニングすることができる。
しかし、既存の手法は正確には外挿できないため、長時間の統合ではエラーの蓄積が困難である。
ニューラル演算子とリカレントニューラルネットワークを組み合わせることでこの問題に対処し、オペレータマッピングを学習し、時間的依存関係をキャプチャするリカレント構造を提供する。
論文 参考訳(メタデータ) (2023-03-03T22:19:23Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Spatio-Temporal Recurrent Networks for Event-Based Optical Flow
Estimation [47.984368369734995]
本稿では,イベントベース光フロー推定のためのニューラルネットアーキテクチャを提案する。
このネットワークは、Multi-Vehicle Stereo Event Cameraデータセット上で、セルフ教師付き学習でエンドツーエンドにトレーニングされている。
既存の最先端の手法を大きなマージンで上回る結果が得られた。
論文 参考訳(メタデータ) (2021-09-10T13:37:37Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - A Prospective Study on Sequence-Driven Temporal Sampling and Ego-Motion
Compensation for Action Recognition in the EPIC-Kitchens Dataset [68.8204255655161]
行動認識はコンピュータビジョンにおける最上位の研究分野の一つである。
エゴモーション記録シーケンスは重要な関連性を持つようになった。
提案手法は,このエゴモーションやカメラの動きを推定して対処することを目的としている。
論文 参考訳(メタデータ) (2020-08-26T14:44:45Z) - Handling Variable-Dimensional Time Series with Graph Neural Networks [20.788813485815698]
IoT(Internet of Things)テクノロジは、複数のセンサからデータをキャプチャして、複数のセンサ時系列を生成する。
このようなマルチセンサー時系列モデリングのための既存のニューラルネットワークに基づくアプローチは、一定の入力次元またはセンサー数を想定している。
我々は、時系列のソースごとに異なるセンサーのサブセットの可用性やインストールにより、時系列が入力次元の異なるマルチセンサ時系列からニューラルネットワークモデルをトレーニングすることを検討する。
論文 参考訳(メタデータ) (2020-07-01T12:11:16Z) - Deep ConvLSTM with self-attention for human activity decoding using
wearables [0.0]
本稿では,複数のセンサ時系列データの特徴を捉えつつ,重要な時間点を選択するディープニューラルネットワークアーキテクチャを提案する。
提案手法の有効性を,異なるデータサンプリング戦略にまたがって示すとともに,自己認識機構が大幅に改善したことを示す。
提案手法は、複数の身体センサからの人間の活動のより優れた復号化を、長期間にわたって行うことができる。
論文 参考訳(メタデータ) (2020-05-02T04:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。