論文の概要: Non-parametric Memory for Spatio-Temporal Segmentation of Construction
Zones for Self-Driving
- arxiv url: http://arxiv.org/abs/2101.06865v1
- Date: Mon, 18 Jan 2021 04:02:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 17:54:05.774053
- Title: Non-parametric Memory for Spatio-Temporal Segmentation of Construction
Zones for Self-Driving
- Title(参考訳): 自動走行のための建設ゾーンの時空間分割のための非パラメトリックメモリ
- Authors: Min Bai, Shenlong Wang, Kelvin Wong, Ersin Yumer, Raquel Urtasun
- Abstract要約: 自律走行車周りの局所的な時空を捉えた非パラメトリックメモリ表現の時空間分割を導入する。
我々の表現には3つの重要な特性がある: (i) 過去に見たことを思い出す; (ii) 補強する; (iii) 新しい証拠に基づいて過去の信念を忘れる。
- 参考スコア(独自算出の注目度): 96.38534734221058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce a non-parametric memory representation for
spatio-temporal segmentation that captures the local space and time around an
autonomous vehicle (AV). Our representation has three important properties: (i)
it remembers what it has seen in the past, (ii) it reinforces and (iii) forgets
its past beliefs based on new evidence. Reinforcing is important as the first
time we see an element we might be uncertain, e.g, if the element is heavily
occluded or at range. Forgetting is desirable, as otherwise false positives
will make the self driving vehicle behave erratically. Our process is informed
by 3D reasoning, as occlusion is key to distinguishing between the desire to
forget and to remember. We show how our method can be used as an online
component to complement static world representations such as HD maps by
detecting and remembering changes that should be superimposed on top of this
static view due to such events.
- Abstract(参考訳): 本稿では,自律走行車(AV)周囲の局所的空間と時間を把握する時空間分割のための非パラメトリックメモリ表現を提案する。
我々の表現には3つの重要な特性がある: (i) 過去に見たことを思い出す; (ii) 補強する; (iii) 新しい証拠に基づいて過去の信念を忘れる。
補強は、例えば、その要素が強く隠蔽されているか、範囲内であるような、不確実であるかもしれない要素を初めて見るときに重要である。
偽陽性がなければ、自動運転車が不規則に振る舞うことになるため、忘れることも望ましい。
我々のプロセスは3D推論によって知らされ、隠蔽は忘れたい欲求と忘れたい欲求を区別する鍵となる。
提案手法は,hdマップなどの静的世界表現を補完するオンラインコンポーネントとして,このようなイベントによる静的ビュー上に重畳すべき変更を検出・記憶することにより,どのように利用することができるかを示す。
関連論文リスト
- Nothing Stands Still: A Spatiotemporal Benchmark on 3D Point Cloud
Registration Under Large Geometric and Temporal Change [86.44429778015657]
人工空間の3次元幾何学地図の構築は、基本的なコンピュータビジョンとロボット工学である。
Not Stands Still (NSS)ベンチマークは、大きな空間的および時間的変化を行う3Dシーンの時間的登録に焦点を当てている。
NSSの一環として,建設中または改修中の大規模建築屋内環境において,3次元点雲のデータセットを連続的に取得する。
論文 参考訳(メタデータ) (2023-11-15T20:09:29Z) - Learning with a Mole: Transferable latent spatial representations for
navigation without reconstruction [12.845774297648736]
ほとんどのエンドツーエンドの学習アプローチでは、表現は潜伏しており、通常は明確に定義された解釈を持っていない。
本研究では,目的とする下流タスクとは無関係にシーンの動作可能な表現を学習することを提案する。
学習された表現は、進路から分岐する複数の短いエピソードをナビゲートするように訓練された盲人補助エージェントによって最適化される。
論文 参考訳(メタデータ) (2023-06-06T16:51:43Z) - Evaluating Long-Term Memory in 3D Mazes [10.224858246626171]
Memory Mazeはエージェントの長期記憶を評価するために設計されたランダム化迷路の3Dドメインである。
既存のベンチマークとは異なり、Memory Mazeはエージェントの能力から切り離された長期的なメモリを測定する。
現在のアルゴリズムは、時間の経過とともに縮小したバックプロパゲーションによるトレーニングの恩恵を受け、小さな迷路で成功するが、大きな迷路での人間のパフォーマンスに欠ける。
論文 参考訳(メタデータ) (2022-10-24T16:32:28Z) - Sparse Semantic Map-Based Monocular Localization in Traffic Scenes Using
Learned 2D-3D Point-Line Correspondences [29.419138863851526]
クエリー画像が与えられた場合、カメラのポーズが先行マップに対応すると見積もることが目的である。
既存のアプローチは、登録問題を解決するために、機能レベルでの高密度な点記述子に大きく依存している。
本稿では,よく設計されたディープニューラルネットワークを用いて2D-3D登録を行う,スパースセマンティックマップに基づく単眼位置推定法を提案する。
論文 参考訳(メタデータ) (2022-10-10T10:29:07Z) - Efficient Spatialtemporal Context Modeling for Action Recognition [42.30158166919919]
本稿では,アクション認識のための高密度長範囲コンテキスト情報映像をモデル化するためのRCCA-3Dモジュールを提案する。
我々は, 水平方向, 垂直方向, 深さの各時間における同一線上の点間の関係をモデル化し, 3次元クリスクロス構造を形成する。
非局所的な手法と比較して、RCCA-3DモジュールはビデオコンテキストモデリングにおいてパラメータとFLOPの数を25%と11%削減する。
論文 参考訳(メタデータ) (2021-03-20T14:48:12Z) - Safety-Oriented Pedestrian Motion and Scene Occupancy Forecasting [91.69900691029908]
我々は、個々の動きとシーン占有マップの両方を予測することを提唱する。
歩行者の相対的な空間情報を保存するScene-Actor Graph Neural Network (SA-GNN)を提案する。
2つの大規模な実世界のデータセットで、我々のシーン占有率予測が最先端のモーション予測手法よりも正確でより校正されていることを示した。
論文 参考訳(メタデータ) (2021-01-07T06:08:21Z) - Learning Invariant Representations for Reinforcement Learning without
Reconstruction [98.33235415273562]
本研究では,表現学習が画像などのリッチな観察からの強化学習を,ドメイン知識や画素再構成に頼ることなく促進する方法について検討する。
シミュレーションメトリクスは、連続MDPの状態間の振る舞いの類似性を定量化する。
修正された視覚的 MuJoCo タスクを用いてタスク関連情報を無視する手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-06-18T17:59:35Z) - Road Curb Detection and Localization with Monocular Forward-view Vehicle
Camera [74.45649274085447]
魚眼レンズを装着した校正単眼カメラを用いて3Dパラメータを推定するロバストな手法を提案する。
我々のアプローチでは、車両が90%以上の精度で、リアルタイムで距離を抑えることができる。
論文 参考訳(メタデータ) (2020-02-28T00:24:18Z) - Learning and Memorizing Representative Prototypes for 3D Point Cloud
Semantic and Instance Segmentation [117.29799759864127]
3Dポイントクラウドセマンティクスとインスタンスセグメンテーションは、3Dシーン理解にとって不可欠で基本である。
深層ネットワークは、学習過程における非支配的なケースを忘れやすく、不満足なパフォーマンスをもたらす。
本稿では,多様なサンプルを普遍的にカバーする代表プロトタイプを学習し,記憶するメモリ拡張ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-06T01:07:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。