論文の概要: Improving Online Performance Prediction for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2104.05255v1
- Date: Mon, 12 Apr 2021 07:44:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:08:12.677172
- Title: Improving Online Performance Prediction for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのためのオンラインパフォーマンス予測の改善
- Authors: Marvin Klingner, Andreas B\"ar, Marcel Mross, Tim Fingscheidt
- Abstract要約: オンライン運用における意味的セグメンテーションディープニューラルネットワーク(DNN)の性能を観察するタスクに取り組みます。
多くのハイレベルな決定は、オフラインで評価されるようなDNNに依存しているが、オンライン運用におけるパフォーマンスは不明である。
本稿では,最近提案されている主意味セグメンテーションタスクの性能予測に基づくオンラインパフォーマンス予測手法を提案する。
- 参考スコア(独自算出の注目度): 29.726236358091295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we address the task of observing the performance of a semantic
segmentation deep neural network (DNN) during online operation, i.e., during
inference, which is of high importance in safety-critical applications such as
autonomous driving. Here, many high-level decisions rely on such DNNs, which
are usually evaluated offline, while their performance in online operation
remains unknown. To solve this problem, we propose an improved online
performance prediction scheme, building on a recently proposed concept of
predicting the primary semantic segmentation task's performance. This can be
achieved by evaluating the auxiliary task of monocular depth estimation with a
measurement supplied by a LiDAR sensor and a subsequent regression to the
semantic segmentation performance. In particular, we propose (i) sequential
training methods for both tasks in a multi-task training setup, (ii) to share
the encoder as well as parts of the decoder between both task's networks for
improved efficiency, and (iii) a temporal statistics aggregation method, which
significantly reduces the performance prediction error at the cost of a small
algorithmic latency. Evaluation on the KITTI dataset shows that all three
aspects improve the performance prediction compared to previous approaches.
- Abstract(参考訳): 本稿では,オンライン操作,すなわち,自動運転などの安全クリティカルなアプリケーションにおいて重要となる推論中における,セマンティックセグメンテーション深層ニューラルネットワーク(dnn)の性能を観察するタスクについて述べる。
ここでは、多くのハイレベルな決定は、通常オフラインで評価されるようなDNNに依存しているが、オンライン操作のパフォーマンスは未だに不明である。
そこで本研究では,最近提案されたセマンティックセグメンテーションタスクの性能予測という概念に基づいて,オンラインのパフォーマンス予測手法の改良を提案する。
これは、LiDARセンサによって供給された測定値を用いて単眼深度推定の補助タスクを評価し、その後、セマンティックセグメンテーション性能に回帰することで実現できる。
特に、(i)マルチタスクトレーニングにおける両タスクの逐次訓練方法、(ii)エンコーダとデコーダの一部を両タスクネットワーク間で共有して効率を向上させること、(iii)アルゴリズム遅延の少ないコストで性能予測誤差を著しく低減する時間統計集計法を提案する。
KITTIデータセットの評価では,従来の手法に比べて3つの側面が性能予測を改善している。
関連論文リスト
- Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文 参考訳(メタデータ) (2024-08-21T06:48:38Z) - An End-to-End Reinforcement Learning Based Approach for Micro-View Order-Dispatching in Ride-Hailing [8.892147201091726]
ディディにおけるエンドツーエンドの強化学習に基づく秩序分散手法を提案する。
我々はこの問題をモデル化するために2層決定プロセスフレームワークを使用し、注文代入を生成するエンコーダ-デコーダ構造ネットワークであるアンダーラインDouble underlineScalable underlineNetwork (DSN2)を提案する。
コンテキストダイナミクスを活用することで、私たちのアプローチは行動パターンに適応してパフォーマンスを向上させることができます。
論文 参考訳(メタデータ) (2024-08-20T01:30:53Z) - A Multi-Stage Goal-Driven Network for Pedestrian Trajectory Prediction [6.137256382926171]
本稿では,多段階目標駆動ネットワーク(MGNet)と呼ばれる,歩行者軌道予測の新しい手法を提案する。
ネットワークは、条件付き変分オートエンコーダ(CVAE)、アテンションモジュール、多段階ゴール評価器の3つの主要コンポーネントから構成される。
MGNetの有効性は、JAADおよびPIEデータセットに関する総合的な実験を通して示される。
論文 参考訳(メタデータ) (2024-06-26T03:59:21Z) - AIO-P: Expanding Neural Performance Predictors Beyond Image
Classification [22.743278613519152]
アーキテクチャの例でニューラルネットワーク予測器を事前訓練するための新しいオールインワン予測器(AIO-P)を提案する。
AIO-Pは平均絶対誤差(MAE)とスピアマンランク相関(SRCC)をそれぞれ1%以下と0.5以上で達成できる。
論文 参考訳(メタデータ) (2022-11-30T18:30:41Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Adaptive Inference through Early-Exit Networks: Design, Challenges and
Directions [80.78077900288868]
初期のネットワークの設計手法をその重要コンポーネントに分解し、各コンポーネントの最近の進歩を調査する。
我々は、他の効率的な推論ソリューションと早期に競合する立場をとり、この分野の研究における現在の課題と最も有望な今後の方向性についての洞察を提供する。
論文 参考訳(メタデータ) (2021-06-09T12:33:02Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Learning to Relate Depth and Semantics for Unsupervised Domain
Adaptation [87.1188556802942]
教師なしドメイン適応(UDA)設定において,視覚的タスク関係を符号化してモデル性能を向上させる手法を提案する。
本稿では,意味的および深さ的予測のタスク依存性を符号化する新しいクロスタスク関係層(ctrl)を提案する。
さらに、セマンティック擬似ラベルを利用してターゲットドメインを監督する反復自己学習(ISL)トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-17T13:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。