論文の概要: Importance-Aware Semantic Segmentation in Self-Driving with Discrete
Wasserstein Training
- arxiv url: http://arxiv.org/abs/2010.12440v1
- Date: Wed, 21 Oct 2020 20:43:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 23:42:43.848651
- Title: Importance-Aware Semantic Segmentation in Self-Driving with Discrete
Wasserstein Training
- Title(参考訳): 離散的wassersteinトレーニングによる自動運転における意味セグメンテーションの重要性
- Authors: Xiaofeng Liu, Yuzhuo Han, Song Bai, Yi Ge, Tianxing Wang, Xu Han, Site
Li, Jane You, Ju Lu
- Abstract要約: 本稿では,Wassersteinトレーニングフレームワークにおいて,クラス間の重要な相関関係を組み込むことを提案する。
我々は,異なるバックボーンを持つCamVidおよびCityscapesデータセットについて評価を行った。
- 参考スコア(独自算出の注目度): 44.78636414245145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation (SS) is an important perception manner for self-driving
cars and robotics, which classifies each pixel into a pre-determined class. The
widely-used cross entropy (CE) loss-based deep networks has achieved
significant progress w.r.t. the mean Intersection-over Union (mIoU). However,
the cross entropy loss can not take the different importance of each class in
an self-driving system into account. For example, pedestrians in the image
should be much more important than the surrounding buildings when make a
decisions in the driving, so their segmentation results are expected to be as
accurate as possible. In this paper, we propose to incorporate the
importance-aware inter-class correlation in a Wasserstein training framework by
configuring its ground distance matrix. The ground distance matrix can be
pre-defined following a priori in a specific task, and the previous
importance-ignored methods can be the particular cases. From an optimization
perspective, we also extend our ground metric to a linear, convex or concave
increasing function $w.r.t.$ pre-defined ground distance. We evaluate our
method on CamVid and Cityscapes datasets with different backbones (SegNet,
ENet, FCN and Deeplab) in a plug and play fashion. In our extenssive
experiments, Wasserstein loss demonstrates superior segmentation performance on
the predefined critical classes for safe-driving.
- Abstract(参考訳): セマンティックセグメンテーション(ss)は、各ピクセルを予め決められたクラスに分類する、自動運転車とロボティクスにとって重要な認識方法である。
広く使われているクロスエントロピー(CE)の損失に基づくディープネットワークは、インターセクションオーバユニオン(mIoU)の平均値に大きく進歩している。
しかし、クロスエントロピー損失は、自動運転システムにおける各クラスの異なる重要性を考慮に入れることはできない。
例えば、画像内の歩行者は運転の決定を行う際に周囲の建物よりもはるかに重要であり、そのセグメンテーションの結果は可能な限り正確であることが期待される。
本稿では,wassersteinのトレーニングフレームワークにおいて,基底距離行列を構成することによって,クラス間相関の重要性を認識することを提案する。
基底距離行列は特定のタスクの優先順位に従って事前に定義することができ、以前の重要度を無視する手法は特定の場合である。
最適化の観点からは、地上距離を線形、凸あるいは凹凸増加関数$w.r.t.$事前定義された地上距離まで拡張する。
我々は,異なるバックボーン(SegNet,ENet,FCN,Deeplab)を持つCamVidとCityscapesのデータセットをプラグアンドプレイ方式で評価した。
拡張実験では、ワッサースタイン損失は、安全運転のための予め定義された臨界クラスにおいて、より優れたセグメンテーション性能を示す。
関連論文リスト
- Boosting Generalizability towards Zero-Shot Cross-Dataset Single-Image Indoor Depth by Meta-Initialization [17.822554284161868]
我々は、勾配に基づくメタラーニングを用いて、ゼロショットのクロスデータセット推論における高い一般化性を得る。
我々は、ゼロショットのクロスデータセットプロトコルを提案し、メタ初期化によって誘導される高い一般化性を検証した。
論文 参考訳(メタデータ) (2024-09-04T07:25:50Z) - CARD: Semantic Segmentation with Efficient Class-Aware Regularized
Decoder [31.223271128719603]
特徴学習におけるクラス内分散とクラス間距離を最適化するためのクラス認識正規化(CAR)手法を提案する。
CARはトレーニング中に既存のほとんどのセグメンテーションモデルに直接適用することができ、追加の推論オーバーヘッドなしに精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2023-01-11T01:41:37Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Standardized Max Logits: A Simple yet Effective Approach for Identifying
Unexpected Road Obstacles in Urban-Scene Segmentation [18.666365568765098]
本稿では,各予測クラスにおける最大ロジットの相対的意味を反映し,各分布を整列させるため,最大ロジットを標準化する,単純かつ効果的なアプローチを提案する。
提案手法は,一般公開されているFishyscapes Lost & Foundのリーダーボード上での最先端のパフォーマンスを高いマージンで達成する。
論文 参考訳(メタデータ) (2021-07-23T14:25:02Z) - Video Class Agnostic Segmentation Benchmark for Autonomous Driving [13.312978643938202]
特定の安全クリティカルなロボティクスアプリケーションでは、トレーニング時に未知のものを含むすべてのオブジェクトを分割することが重要です。
自律運転における単眼ビデオシーケンスから未知の物体を考慮に入れたビデオクラスセグメンテーションのタスクを定式化する。
論文 参考訳(メタデータ) (2021-03-19T20:41:40Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Reinforced Wasserstein Training for Severity-Aware Semantic Segmentation
in Autonomous Driving [45.11602128316305]
我々は,クラス間の相関関係を,その基準を誤分類の重大度として定義し,学習枠組みを構築した。
CamVidとCityscapesのデータセットでの実験は、ワッサースタインの損失の有効性を実証した。
論文 参考訳(メタデータ) (2020-08-11T15:00:41Z) - Spatiotemporal Relationship Reasoning for Pedestrian Intent Prediction [57.56466850377598]
視覚データに対する推論は、ロボティクスとビジョンベースのアプリケーションにとって望ましい能力である。
本稿では,歩行者の意図を推論するため,現場の異なる物体間の関係を明らかにするためのグラフ上でのフレームワークを提案する。
歩行者の意図は、通りを横切る、あるいは横断しない将来の行動として定義され、自動運転車にとって非常に重要な情報である。
論文 参考訳(メタデータ) (2020-02-20T18:50:44Z) - Key Points Estimation and Point Instance Segmentation Approach for Lane
Detection [65.37887088194022]
本稿では,PINet (Point Instance Network) と呼ばれるトラヒックライン検出手法を提案する。
PINetには、同時にトレーニングされる複数のスタックされた時間ガラスネットワークが含まれている。
PINetはTuSimpleとCulaneのデータセットで競合精度と偽陽性を達成する。
論文 参考訳(メタデータ) (2020-02-16T15:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。