論文の概要: Universal Embeddings for Spatio-Temporal Tagging of Self-Driving Logs
- arxiv url: http://arxiv.org/abs/2011.06165v1
- Date: Thu, 12 Nov 2020 02:18:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 07:01:08.378407
- Title: Universal Embeddings for Spatio-Temporal Tagging of Self-Driving Logs
- Title(参考訳): 自動ログの時空間タギングのためのユニバーサル埋め込み
- Authors: Sean Segal, Eric Kee, Wenjie Luo, Abbas Sadat, Ersin Yumer, Raquel
Urtasun
- Abstract要約: 我々は、生のセンサデータから、自動運転シーンの時間的タグ付けの問題に取り組む。
提案手法では,全てのタグに対する普遍的な埋め込みを学習し,多くの属性を効率的にタグ付けし,限られたデータで新しい属性を高速に学習する。
- 参考スコア(独自算出の注目度): 72.67604044776662
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we tackle the problem of spatio-temporal tagging of
self-driving scenes from raw sensor data. Our approach learns a universal
embedding for all tags, enabling efficient tagging of many attributes and
faster learning of new attributes with limited data. Importantly, the embedding
is spatio-temporally aware, allowing the model to naturally output
spatio-temporal tag values. Values can then be pooled over arbitrary regions,
in order to, for example, compute the pedestrian density in front of the SDV,
or determine if a car is blocking another car at a 4-way intersection. We
demonstrate the effectiveness of our approach on a new large scale self-driving
dataset, SDVScenes, containing 15 attributes relating to vehicle and pedestrian
density, the actions of each actor, the speed of each actor, interactions
between actors, and the topology of the road map.
- Abstract(参考訳): 本稿では,センサデータから自動運転車シーンの時空間的タグ付けの問題に取り組む。
提案手法では,全てのタグに対する普遍的な埋め込みを学習し,多くの属性を効率的にタグ付けし,限られたデータで新しい属性を高速に学習する。
重要なことに、埋め込みは時空間的に認識され、モデルが自然に時空間タグ値を出力することができる。
例えば、SDVの前で歩行者密度を計算したり、車が他の車を4方向の交差点でブロックしているかどうかを判断するために、任意の領域に値が格納される。
本研究では,車と歩行者の密度,各アクタの行動,各アクタの速度,アクタ間の相互作用,道路地図のトポロジーに関する15の属性を含む,新たな大規模自動運転データセットsdscenesにおける提案手法の有効性を実証する。
関連論文リスト
- DAVE: Diverse Atomic Visual Elements Dataset with High Representation of Vulnerable Road Users in Complex and Unpredictable Environments [60.69159598130235]
Vulnerable Road Users (VRU) の高表現による認識手法の評価を目的とした新しいデータセット DAVE を提案する。
DAVEは16種類のアクターカテゴリー(動物、人間、車など)と16種類のアクションタイプ(カットイン、ジグザグ運動、Uターンなど、複雑で稀なケース)を手動でアノテートしたデータセットである。
実験の結果,既存の手法はDAVEで評価すると性能の劣化に悩まされ,将来的なビデオ認識研究のメリットを浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2024-12-28T06:13:44Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Autosen: improving automatic wifi human sensing through cross-modal
autoencoder [56.44764266426344]
WiFiによる人間のセンシングは、人間の活動を認識する上での低コストでプライバシー上の利点として高く評価されている。
ラベル付きデータなしで自己教師付き学習を可能にすることを目的とした従来のクロスモーダル手法は、振幅-位相の組み合わせから意味のある特徴を抽出するのに苦労する。
我々は、従来のアプローチから外れた革新的な自動WiFiセンシングソリューションであるAutoSenを紹介する。
論文 参考訳(メタデータ) (2024-01-08T19:50:02Z) - A Large-Scale Car Parts (LSCP) Dataset for Lightweight Fine-Grained
Detection [0.23020018305241333]
本稿では,12種類の自動車部品を検出するため,84,162枚の画像からなる大規模できめ細かな自動車データセットを提案する。
手動アノテーションの負担を軽減するため,新しい半教師付き自動ラベリング手法を提案する。
また,ゼロショットラベリングにおけるグラウンディングDINOアプローチの限界についても検討する。
論文 参考訳(メタデータ) (2023-11-20T13:30:42Z) - Leveraging Road Area Semantic Segmentation with Auxiliary Steering Task [0.0]
ステアリングホイール角情報を利用して道路領域のセマンティックセグメンテーションを改善するCNNに基づく手法を提案する。
本稿では,自律運転のための2つの挑戦的データセットに対する提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-12-19T13:25:09Z) - Interaction Detection Between Vehicles and Vulnerable Road Users: A Deep
Generative Approach with Attention [9.442285577226606]
交差点における相互作用検出のための条件生成モデルを提案する。
道路利用者の行動の連続性に関する膨大な映像データを自動解析することを目的としています。
モデルの有効性は実世界のデータセットでテストすることによって検証された。
論文 参考訳(メタデータ) (2021-05-09T10:03:55Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - The Pedestrian Patterns Dataset [11.193504036335503]
データセットは、異なる特定のタイムスロットから1週間、同じ3つのルートを繰り返すことで収集された。
データセットの目的は、横断するルートに沿って異なる時間に、社会的および歩行者の行動パターンをキャプチャすることである。
論文 参考訳(メタデータ) (2020-01-06T23:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。